OpenAI đã công bố bản cập nhật cho ứng dụng máy tính để bàn ChatGPT dành cho macOS, giới thiệu tính năng điều khiển bằng giọng nói và mã hóa nâng cao. Giờ đây, người dùng Mac có thể trải nghiệm cách tiếp cận tương tác và rảnh tay hơn khi sử dụng ChatGPT, làm mờ hơn nữa ranh giới giữa tương tác giữa con người và máy tính.
Bản cập nhật này là một phần trong loạt thông báo “12 ngày của OpenAI” , nơi công ty phát hành các tính năng và bản cập nhật mới cho các sản phẩm chính của mình.
Chế độ giọng nói nâng cao trên macOS
Ứng dụng ChatGPT Mac được cập nhật có Chế độ giọng nói nâng cao, cho phép người dùng nói lên yêu cầu của họ ChatGPT thay vì nhập. Điều này có nghĩa là người dùng có thể yêu cầu ChatGPT soạn thảo email, lên ý tưởng hoặc gỡ lỗi mã, tất cả đều thông qua lệnh thoại. 2024/12/ChatGPT-macOS.jpg”>
OpenAI CPO Kevin Weil đã trình diễn khả năng mới này, hiển thị ChatGPT nổi trên màn hình Mac và phản hồi các yêu cầu bằng giọng nói ngay cả khi người dùng đang thực hiện các tác vụ khác.
[nội dung được nhúng]
Việc bổ sung Chế độ giọng nói nâng cao mang lại cách tương tác tự nhiên và trực quan hơn với ChatGPT. Giờ đây, người dùng có thể nói yêu cầu của mình, khiến trải nghiệm giống như tương tác với trợ lý con người hơn. Điều này đặc biệt hữu ích cho các tác vụ yêu cầu đa nhiệm hoặc khi ưu tiên thao tác rảnh tay.
ChatGPT với tư cách là Người đồng hành mã hóa
Một tính năng nổi bật là khả năng được cải thiện của ChatGPT để tương tác trực tiếp với mã trong các trình soạn thảo phổ biến như Warp và Xcode. Thay vì sao chép và dán mã vào giao diện ChatGPT, người dùng chỉ cần yêu cầu ChatGPT phân tích mã hiển thị trên màn hình của họ. Sau đó, AI có thể đưa ra đề xuất, giải thích hoặc thậm chí viết đoạn mã mới trực tiếp vào trình chỉnh sửa.
Điều này cải thiện khả năng tích hợp ChatGPT với các môi trường mã hóa như VS Code, Xcode, Terminal và iTerm2 mà OpenAI đã thêm vào Tháng 11.
Ngoài việc viết mã, ChatGPT còn có thể tích hợp với các ứng dụng ghi chú như Apple Notes, Quip và Notion. Ví dụ: người dùng lên kế hoạch cho một chuyến đi trong Notion có thể yêu cầu ChatGPT giúp đưa ra ý tưởng của họ, bao gồm cả việc trích dẫn các nguồn có liên quan từ internet.
Động thái hướng tới tích hợp ứng dụng này là một bước tiến tới tầm nhìn của OpenAI về “đại lý” AI, trong đó ChatGPT thực hiện các nhiệm vụ thay mặt người dùng, kết hợp các khả năng của nhiều ứng dụng thành một gói tiện lợi duy nhất. “Đây là điều mà OpenAI gọi là cách tiếp cận “tác nhân” đối với AI, trong đó ChatGPT thực hiện các nhiệm vụ thay mặt bạn,” giải thích. Weil.
Các tính năng mã hóa nâng cao trong ứng dụng Mac đã cập nhật giúp ChatGPT trở thành một công cụ có giá trị dành cho nhà phát triển. Bằng cách tương tác trực tiếp với mã trong các trình chỉnh sửa phổ biến, ChatGPT có thể giúp hợp lý hóa quy trình công việc và cung cấp hỗ trợ theo thời gian thực.
“Giả sử bạn đang sử dụng trình chỉnh sửa mã như Warp và nhìn chằm chằm vào một danh sách mã dài, khó hiểu. Thay vì cuộn liên tục, bạn có thể yêu cầu ChatGPT phân tích nội dung trên màn hình và nó sẽ đưa ra gợi ý, giải thích, hoặc thậm chí viết đoạn mã mới,”Weil giải thích trong buổi trình diễn.
Tích hợp ứng dụng: Hướng tới AI đại lý
Việc tích hợp với các ứng dụng ghi chú như Apple Notes, Quip và Notion mở rộng hơn nữa khả năng của ChatGPT. Nó cho phép người dùng tận dụng sự hỗ trợ của AI để thực hiện nhiều nhiệm vụ hơn, từ lập kế hoạch và tổ chức đến viết và nghiên cứu.
“Nếu bạn đang lên kế hoạch cho một chuyến đi và sử dụng Notion để ghi lại các ý tưởng, bạn có thể yêu cầu Weil cho biết thêm ChatGPT để giúp bổ sung thêm thông tin, bao gồm cả việc trích dẫn các nguồn từ internet”.
Mặc dù các tính năng mới này hiện chỉ dành riêng cho người dùng Mac nhưng OpenAI đã thông báo rằng bản cập nhật cho ứng dụng Windows đang được phát triển. Không có khung thời gian cụ thể cho bản cập nhật Windows đã đưa ra.
Các thông báo trước đó trong “12 ngày của OpenAI”
Vào ngày 19 tháng 12, OpenAI đã ra mắt số điện thoại miễn phí và quyền truy cập WhatsApp cho ChatGPT, giúp chatbot AI dễ tiếp cận hơn.
Ngày 18 tháng 12 đã mang đến quyền truy cập API cho phiên bản đầy đủ của mô hình OpenAI o1, cải tiến API thời gian thực cho tương tác bằng giọng nói và tinh chỉnh tùy chọn mới phương pháp này.
Vào ngày 16 tháng 12, OpenAI đã cung cấp tính năng tìm kiếm trên web trực tiếp ChatGPT cho tất cả người dùng, cho phép mọi người truy xuất thông tin cập nhật trực tiếp từ web.
Ngày 14 tháng 12 đã mang đến các tùy chọn tùy chỉnh mới cho ChatGPT, cho phép người dùng hợp lý hóa các công việc và quản lý dự án một cách hiệu quả. Projects cho phép người dùng nhóm các cuộc trò chuyện, tệp và hướng dẫn tùy chỉnh vào các thư mục chuyên dụng, tạo ra một không gian làm việc có tổ chức để quản lý nhiệm vụ và quy trình làm việc.
Là một cải tiến lớn đối với chế độ giọng nói nâng cao dành cho ChatGPT, OpenAI đã được bổ sung vào ngày 12 tháng 12 khả năng thị giác, cho phép người dùng chia sẻ màn hình và video trực tiếp để phân tích và hỗ trợ theo thời gian thực.
Vào ngày 11 tháng 12, OpenAI đã phát hành đầy đủ Canvas, một không gian làm việc chỉnh sửa cộng tác cung cấp các công cụ nâng cao để sàng lọc cả văn bản và mã. Lần đầu ra mắt dưới dạng beta vào tháng 10 năm 2024, Canvas thay thế giao diện tiêu chuẩn của ChatGPT bằng thiết kế chia đôi màn hình, cho phép người dùng làm việc trên văn bản hoặc mã trong khi tham gia trao đổi hội thoại với AI.
Việc bổ sung khả năng thực thi Python là một tính năng nổi bật của Canvas, cho phép các nhà phát triển viết, kiểm tra và gỡ lỗi các tập lệnh trực tiếp trong nền tảng. OpenAI đã thể hiện tiện ích của mình trong một sự kiện trực tiếp bằng cách sử dụng Python để tạo và tinh chỉnh trực quan hóa dữ liệu. OpenAI mô tả tính năng này là “giảm ma sát giữa việc tạo và triển khai ý tưởng”.
Vào ngày 9 tháng 12, OpenAI đã chính thức ra mắt Sora, công cụ AI tiên tiến giúp tạo video từ lời nhắc bằng văn bản, báo hiệu một kỷ nguyên mới cho AI sáng tạo. Được tích hợp vào các tài khoản ChatGPT trả phí, Sora cho phép người dùng tạo hoạt ảnh cho hình ảnh tĩnh, mở rộng video hiện có và hợp nhất các cảnh thành các câu chuyện liền mạch.
Được phát hành vào ngày 7 tháng 12 là Tinh chỉnh tăng cường dưới dạng một khung mới được thiết kế để cho phép tùy chỉnh các mô hình AI cho các ứng dụng dành riêng cho ngành. Đây là cách tiếp cận mới nhất của OpenAI để cải thiện các mô hình AI bằng cách đào tạo chúng bằng các bộ dữ liệu và hệ thống chấm điểm do nhà phát triển cung cấp. Không giống như phương pháp học tập có giám sát truyền thống, vốn tập trung vào việc tái tạo các kết quả đầu ra mong muốn
Vào ngày 5 tháng 12, OpenAI đã ra mắt ChatGPT Pro, một gói đăng ký cao cấp mới có giá 200 USD mỗi tháng, nhắm đến các chuyên gia và doanh nghiệp đang tìm kiếm khả năng AI nâng cao cho quy trình làm việc có nhu cầu cao.