Ngày 30/7 vừa qua, OpenAI chính thức giới thiệu tính năng giọng nói AI tiên tiến cho ChatGPT, mang lại trải nghiệm giọng nói tự nhiên và gần gũi như con người thật. Công nghệ này, được gọi là GPT-4o, không chỉ hỗ trợ phản hồi nhanh mà còn cảm nhận được cảm xúc từ giọng nói của người dùng, đánh dấu một bước đột phá trong lĩnh vực trí tuệ nhân tạo.


Quá trình phát triển giọng nói AI cho ChatGPT

Trong lần ra mắt đầu tiên vào tháng 5, OpenAI đã gây chú ý với giọng nói AI tự nhiên đáng kinh ngạc của GPT-4o. Trong bản demo, giọng nói “Sky” được giới thiệu có nét giống với nữ diễn viên Scarlett Johansson. Tuy nhiên, sau khi Johansson từ chối cho phép sử dụng giọng nói của mình, OpenAI đã thay thế bằng một mẫu giọng mới.

Để đảm bảo an toàn và tránh các tranh cãi liên quan đến deepfake, OpenAI đã tiến hành thử nghiệm công nghệ này trên 45 ngôn ngữ với sự tham gia của hơn 100 nhóm đánh giá độc lập. Kết quả thử nghiệm dự kiến được công bố vào đầu tháng 8, trước khi triển khai rộng rãi.


Đột phá công nghệ GPT-4o

Trước đây, ChatGPT phải sử dụng ba mô hình riêng biệt để:

  • Chuyển đổi giọng nói thành văn bản.
  • Xử lý yêu cầu từ văn bản.
  • Tạo giọng nói phản hồi.

Với GPT-4o, toàn bộ quá trình này được tích hợp trong một mô hình duy nhất, giúp tăng tốc độ xử lý và giảm độ trễ. Ngoài việc tái tạo giọng nói, GPT-4o còn có khả năng cảm nhận cảm xúc như vui, buồn, hào hứng, thậm chí có thể hát, tạo ra trải nghiệm tự nhiên và chân thật hơn bao giờ hết.


Triển khai tính năng giọng nói AI

Hiện tại, tính năng giọng nói AI đang được phát hành theo từng giai đoạn, bắt đầu với nhóm người dùng alpha. Đến mùa thu năm 2024, tính năng này sẽ có mặt cho tất cả người dùng ChatGPT Plus.

GPT-4o cung cấp bốn giọng nói mặc định: Juniper, Breeze, Cove, và Ember, được phát triển cùng các diễn viên lồng tiếng chuyên nghiệp. Để đảm bảo minh bạch, OpenAI cam kết không giả mạo giọng nói của bất kỳ cá nhân hay tổ chức nào, đồng thời áp dụng các bộ lọc nghiêm ngặt để ngăn chặn yêu cầu tạo nội dung có bản quyền.


Ứng dụng và thách thức

Công nghệ giọng nói AI mở ra nhiều cơ hội ứng dụng mới trong giao tiếp thông minh, hỗ trợ học tập, làm việc, và thậm chí giải trí. Tuy nhiên, OpenAI cũng đối mặt với các thách thức liên quan đến vấn đề pháp lý và đạo đức.

Trong tương lai, GPT-4o hứa hẹn tiếp tục cải tiến để mang lại trải nghiệm tốt hơn, góp phần đưa trí tuệ nhân tạo đến gần hơn với cuộc sống hàng ngày.


Mở rộng trải nghiệm với ChatGPT Plus

Để trải nghiệm đầy đủ tính năng giọng nói AI tự nhiên của GPT-4o cùng nhiều tiện ích nâng cao khác, hãy tham khảo ngay tài khoản ChatGPT Plus giá rẻ, chất lượng cao tại:


👉 https://thegioipremium.com/tai-khoan-chat-gpt-plus-co-gpt-4/

Đừng bỏ lỡ cơ hội sở hữu công cụ AI tiên tiến hỗ trợ học tập và làm việc hiệu quả hơn!