Trong sự kiện được phát sóng trực tiếp, Giám đốc công nghệ Mira Murati cho biết bản cập nhật mang GPT-4 đến với tất cả mọi người, bao gồm cả người dùng miễn phí của OpenAI. Bà nói thêm rằng mô hình mới, GPT-4o, "nhanh hơn nhiều” so với phiên bản trước đó. Công ty có kế hoạch cho phép người dùng trò chuyện video với ChatGPT.

Chữ o trong GPT-4o là viết tắt của omni. Mô hình mới cho phép ChatGPT xử lý 50 ngôn ngữ khác nhau với tốc độ và chất lượng được cải thiện. Nó cũng có sẵn thông qua API của OpenAI để giúp các nhà phát triển bắt đầu xây dựng ứng dụng bằng mô hình mới ngay. Theo bà Murati, GPT-4o nhanh gấp đôi và chi phí bằng một nửa GPT-4 Turbo.

Để minh họa tính năng âm thanh của mô hình mới, các thành viên của OpenAI đã yêu cầu nó giúp ai đó bình tĩnh hơn trước khi phát biểu trước công chúng. Theo nhà nghiên cứu Mark Chen, mô hình có thể "cảm nhận được cảm xúc của bạn". Nhóm nghiên cứu cũng yêu cầu nó phân tích biểu cảm khuôn mặt của người dùng để nhận xét về cảm xúc mà người đó có thể đang trải qua.

"Này, có chuyện gì vậy? Làm thế nào để tôi làm cho hôm nay của bạn vui vẻ hơn?", chế độ âm thanh của ChatGPT hồi đáp khi người dùng chào nó.

OpenAI dự định thử nghiệm chế độ Voice (giọng nói) trong những tuần tới và người dùng trả phí ChatGPT Plus có thể truy cập sớm. Mô hình mới phản hồi lời nhắc (prompt) âm thanh của người dùng "chỉ trong 232 mili giây, với trung bình 320 mili giây, tương tự như thời gian phản hồi của con người trong một cuộc trò chuyện".

Chen trình diễn khả năng kể chuyện của mô hình trước khi ngủ và yêu cầu nó thay đổi giọng nói để trở nên kịch tính hơn. Thậm chí, ông còn yêu cầu nó hát một câu chuyện.

Ngoài ra, mô hình mới của OpenAI có thể hoạt động như một công cụ dịch, ngay cả ở chế độ âm thanh. Chen đã chứng minh khả năng của công cụ này khi nghe Murati nói tiếng Italy trong khi ông nói tiếng Anh và dịch sang ngôn ngữ tương ứng của họ khi trò chuyện.

Bên cạnh đó, mô hình còn giải các phương trình toán học và hỗ trợ lập trình, cạnh tranh với GitHub Copilot của Microsoft.

OpenAI, Microsoft và Google đang dẫn đầu cuộc đua AI trong khi các công ty trong mọi ngành công nghiệp đang nỗ lực bổ sung các chatbot AI vào các dịch vụ chính để tránh bị bỏ lại phía sau. Đầu tháng này, Anthropic đã công bố sản phẩm doanh nghiệp đầu tiên và một ứng dụng iPhone miễn phí.

Theo PitchBook, năm 2023, số tiền kỷ lục 29,1 tỷ USD được đổ vào gần 700 thương vụ AI, tăng hơn 260% so với một năm trước. Thị trường được dự đoán đạt doanh thu 1.000 tỷ USD trong vòng 10 năm.

Sau khi ChatGPT ra mắt vào tháng 11/2022, nó đã phá kỷ lục ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử và hiện có khoảng 100 triệu người dùng hoạt động hằng tuần. OpenAI cho biết hơn 92% các công ty trong danh sách Fortune 500 đang sử dụng nền tảng này.

Murati kết thúc sự kiện phát trực tiếp bằng cách cảm ơn CEO Nvidia Jensen Huang và công ty của ông đã cung cấp các đơn vị xử lý đồ họa (GPU) cần thiết để hỗ trợ công nghệ của OpenAI.

(Theo CNBC)