Công nghệ

OpenAI ra mắt trợ lý AI đầu tiên, đặt bàn, mua sắm thay chủ nhân

Các chuyên gia dự đoán 2025 sẽ là năm AI agent trở nên phổ biến. OpenAI đang hiện thực hóa dự báo này với Operator, hệ thống sử dụng trình duyệt web để đặt vé du lịch hay mua sắm sản phẩm.

Nếu chatbot như ChatGPT dùng AI tạo sinh để phản hồi lại các câu hỏi, thì Operator được thiết kế để tự động thực hiện tác vụ. OpenAI cho biết công cụ mới dành cho người dùng ChatGPT Pro tại Mỹ.

Giao diện công cụ Operator của OpenAI. (Ảnh: OpenAI)

Giao diện công cụ Operator của OpenAI. (Ảnh: OpenAI)

Trong những tháng tiếp theo, nó cũng sẽ có sẵn với người dùng ChatGPT Plus và tại các nước khác.

Khi giới thiệu Operator trên livestream, CEO OpenAI Sam Altman gọi đây mới là “bản xem trước” và nó sẽ được tinh chỉnh theo thời gian. Công ty cũng đang chuẩn bị ra nhiều trợ lý hơn.

Giao diện của Operator khá giống ChatGPT. Người dùng có thể yêu cầu nó đặt bàn cho bữa tối vào lúc 7h và thực hiện nhiệm vụ qua một website cụ thể như OpenTable hoặc qua công cụ tìm kiếm như Google.

Operator sẽ tóm tắt quá trình suy luận trong thanh bên (sidebar) để người dùng tìm xem bước nào có sai sót.

Người dùng cũng có thể tải danh sách đồ tạp hóa cần mua bằng chữ viết tay rồi yêu cầu Operator mua sắm từ website cụ thể như Instacart. Nếu không có website nào được chọn, nó sẽ mặc định thực hiện qua công cụ tìm kiếm.

Reiichiro Nakano, thành viên trong nhóm kỹ thuật, chia sẻ Operator dựa trên CUA, mô hình phát triển trên GPT-4o. Mô hình không cần đến API và mở ra một loạt phần mềm mới mà trước đó không tiếp cận được.

Nó cũng xóa bỏ thêm một “điểm nghẽn” trong lộ trình hướng đến trí tuệ nhân tạo tổng hợp. Tuy nhiên, Operator vẫn cần thời gian trước khi theo kịp khả năng của con người khi điều hướng trên web.

Các tin khác

iPhone của bạn đến từ quốc gia nào?

iPhone của bạn đến từ quốc gia nào?

Với quy trình sản xuất phức tạp và mạng lưới cung ứng toàn cầu, mỗi chiếc iPhone đi qua nhiều quốc gia trên thế giới trước khi đến tay người dùng.
Cách nhận cuộc gọi toàn màn hình trên iPhone

Cách nhận cuộc gọi toàn màn hình trên iPhone

Một trong những tính năng thú vị là khả năng nhận cuộc gọi toàn màn hình, giúp người dùng dễ dàng hơn trong việc nhận biết ai đang gọi, cùng với giao diện đẹp mắt.
Khu công nghệ cao TP HCM muốn thu hút trung tâm R&D

Khu công nghệ cao TP HCM muốn thu hút trung tâm R&D

Ông Nguyễn Kỳ Phùng, trưởng ban quản lý Khu Công nghệ cao TP HCM đánh giá việc thu hút R&D còn nhiều thách thức, nhưng Nghị quyết 57 giúp cụ thể hóa mục tiêu và kế hoạch.