Copilot Vision trong Edge: Mọi thứ bạn có thể làm và cách tận dụng tối đa nó

  • Copilot Vision trên Edge chuyển đổi chức năng điều hướng bằng cách cho phép tương tác bằng giọng nói và phân tích trực quan nội dung trang web, tài liệu và video.
  • Công cụ này nổi bật với khả năng trả lời các truy vấn theo ngữ cảnh, làm nổi bật thông tin có liên quan và hướng dẫn người dùng theo thời gian thực mà không cần phải thao tác thủ công trên trang.
  • Các tính năng của Copilot Vision được tích hợp trực tiếp vào Edge, mang lại quyền riêng tư và được mở rộng hơn nữa cho người đăng ký Pro, mặc dù phiên bản miễn phí đã đáp ứng được nhiều nhu cầu hàng ngày.

Cách sử dụng Copilot Vision trên Edge

Bạn đã bao giờ tự hỏi sẽ thế nào nếu duyệt internet với một trợ lý thông minh không chỉ hiểu những gì bạn gõ mà còn "nhìn thấy" những gì bạn làm trên màn hình và hướng dẫn bạn từng bước không? Đó chính xác là đề xuất của Microsoft với Copilot Vision trên Edge, một tính năng đã cách mạng hóa cách chúng ta tương tác với web, tài liệu và video nhờ trí tuệ nhân tạo và nhận dạng theo ngữ cảnh.

Trong bài viết này, chúng tôi sẽ phân tích mọi thứ liên quan đến Copilot Vision trong Edge: tính năng này chính xác là gì, cách kích hoạt và sử dụng, lợi thế của nó so với các giải pháp khác, trường hợp sử dụng thực tế, tầm quan trọng của quyền riêng tư theo Microsoft và sự khác biệt giữa phiên bản miễn phí và trả phí. Nếu bạn muốn khám phá tiềm năng thực sự của AI được áp dụng vào điều hướng, hãy tiếp tục đọc, vì còn rất nhiều điều để khám phá.

Copilot Vision trong Edge là gì?

Copilot Vision là một tính năng được tích hợp trong trình duyệt Microsoft Edge giúp đưa trí tuệ nhân tạo lên một tầm cao mới.. Không giống như các trợ lý truyền thống chỉ trả lời các câu hỏi chung chung hoặc giới hạn bản thân trong việc trò chuyện, Copilot Vision có thể phân tích nội dung trực quan xuất hiện trên màn hình theo thời gian thực. Điều này có nghĩa là cho dù bạn đang xem một trang web, một tài liệu PDF hay xem video, Copilot Vision đều có thể "nhìn thấy" những gì bạn làm và cung cấp cho bạn thông tin có liên quan ngay lập tức.

Microsoft Azure là gì?
Bài viết liên quan:
Microsoft Azure: Nó là gì, nó hoạt động như thế nào và tất cả các sản phẩm và dịch vụ của nó

Điểm mới lạ chính của Copilot Vision là trải nghiệm giọng nói đàm thoại.. Người dùng có thể kích hoạt công cụ và thông qua lệnh thoại để đặt câu hỏi, yêu cầu giải thích, tóm tắt hoặc thậm chí tìm kiếm thông tin chi tiết cụ thể về nội dung họ đang xem. Ví dụ, nếu bạn đang đọc một công thức nấu ăn hoặc mô tả công việc trên web, bạn có thể yêu cầu Copilot giải thích từng bước bằng lời nói mà không cần phải chạm vào bàn phím hoặc chuột.

Cách thức hoạt động của Copilot Vision: Một cái nhìn sâu sắc

Copilot Vision hoạt động bằng cách diễn giải nội dung bạn đã mở trong Edge.. Khi bạn kích hoạt tính năng này, trợ lý sẽ quan sát những gì bạn thấy trên màn hình và sử dụng các kỹ thuật hiểu ngữ cảnh và hình ảnh tiên tiến để xác định hình ảnh, văn bản hoặc yếu tố chính. Sau đó, nó cho phép bạn thiết lập một cuộc trò chuyện tự nhiên và trôi chảy., thông qua giọng nói hoặc tin nhắn văn bản, để giải đáp thắc mắc của bạn, chỉ ra những phần quan trọng hoặc hướng dẫn bạn thực hiện các nhiệm vụ cụ thể.

Copilot Vision không thực hiện bất kỳ hành động nào thay mặt bạn. (chẳng hạn như nhấp chuột, điền vào biểu mẫu hoặc cuộn qua các trang), nhưng nó có thể làm nổi bật các khu vực cụ thể của màn hình để bạn có thể dễ dàng tìm thấy thông tin bạn đang tìm kiếm. Bằng cách này, nó bổ sung cho trải nghiệm của bạn mà không cần kiểm soát trình duyệt, luôn giữ người dùng ở trung tâm của quá trình tương tác.

Các tính năng và lợi ích chính của Copilot Vision

  • Tương tác bằng giọng nói: Bạn có thể hỏi bất cứ điều gì bằng giọng nói mà không cần phải nhập liệu, rất tiện lợi khi làm nhiều việc cùng lúc.
  • Phân tích ngữ cảnh trực quan: Trợ lý sẽ giải thích hình ảnh và văn bản trên màn hình, cung cấp thông tin có liên quan dựa trên nội dung bạn đang xem chứ không chỉ là câu trả lời chung chung.
  • Nổi bật và trợ giúp thời gian thực: Nếu bạn bị lạc trong một trang đầy thông tin, Copilot Vision sẽ chỉ cho bạn nơi tìm thông tin có liên quan và có thể giải thích cho bạn một cách đơn giản.
  • Nhiệm vụ có hướng dẫn và ví dụ sử dụng: Từ việc đọc công thức nấu ăn mà không dừng lại, đến phân tích bài đăng tuyển dụng, cho đến đưa ra ý tưởng viết thư xin việc phù hợp với bối cảnh của trang.
  • Quyền riêng tư nâng cao: Microsoft tuyên bố họ chỉ lưu trữ các phản hồi do Copilot tạo ra để cải thiện dịch vụ, nhưng không ghi lại hình ảnh, giọng nói đầu vào hoặc biên dịch nội dung trang.
  • Có sẵn miễn phí và mở rộng liên tục: Hiện tại, người dùng Edge có thể sử dụng Copilot Vision mà không mất thêm chi phí, mặc dù các tính năng nâng cao chỉ dành riêng cho phiên bản Pro.

Cách kích hoạt và bắt đầu sử dụng Copilot Vision trên Edge

Quá trình cho kích hoạt Copilot Vision Thật đơn giản và không cần cài đặt thêm bất cứ thứ gì nếu bạn đã cập nhật Edge trên thiết bị của mình.

  1. Đăng nhập vào Edge bằng tài khoản Microsoft cá nhân. Tài khoản phải là tài khoản cá nhân vì Copilot Vision không áp dụng cho tài khoản doanh nghiệp hoặc trường học.
  2. Điều hướng đến trang web, tài liệu PDF hoặc video mà bạn muốn hỏi. Bạn có thể thử bất kỳ nội dung nào có thể duyệt được trong Edge.
  3. Nhấp vào biểu tượng Copilot ở góc trên bên phải của trình duyệt để hiển thị thanh bên.
  4. Nhấn nút micrô để bắt đầu tương tác bằng giọng nói. Bạn có thể đặt câu hỏi trực tiếp hoặc để Copilot Vision giải thích hoặc tóm tắt nội dung bạn đang xem.
  5. Để kết thúc phiên làm việc, bạn chỉ cần đóng trải nghiệm Copilot hoặc cửa sổ Edge.

Lưu ý quan trọng: Lần đầu tiên bạn sử dụng Copilot Vision, Microsoft sẽ yêu cầu bạn chấp nhận thông báo về quyền riêng tư. Việc đảm bảo tính minh bạch trong việc sử dụng dữ liệu là điều cần thiết.

Đại lý Microsoft Security Copilot-1
Bài viết liên quan:
Microsoft giới thiệu các tác nhân Security Copilot

Ví dụ thực tế về những gì bạn có thể làm với công cụ này

Khả năng của Copilot Vision cũng đa dạng như khả năng duyệt Internet.. Theo tài liệu và phương tiện công nghệ đã phân tích công cụ này, sau đây là một số công dụng phổ biến và hữu ích nhất:

  • Đọc công thức từng bước trong khi nấu ăn, lắng nghe hướng dẫn và không chạm vào máy tính. Thích hợp cho những căn bếp bận rộn.
  • Phân tích mô tả công việc khi phỏng vấn, hãy yêu cầu giải thích chi tiết về nhiệm vụ, yêu cầu hoặc năng lực của công việc.
  • Tạo ý tưởng cho thư xin việc phù hợp với bối cảnh việc làm mà bạn đang tham khảo, mặc dù không nên sử dụng nó để tạo một bản sơ yếu lý lịch hoàn chỉnh (do những tài liệu này yêu cầu phải tùy chỉnh).
  • Giải quyết những nghi ngờ về các khái niệm phức tạp trích xuất định nghĩa hoặc ví dụ từ các văn bản dày đặc.
  • Làm nổi bật thông tin chính trên các trang rất dài, để không mất thời gian tìm kiếm dữ liệu quan trọng giữa các khối văn bản.
  • Giải thích đồ thị, sơ đồ hoặc bảng trong các tài liệu kỹ thuật hoặc học thuật.
  • Hỗ trợ các thủ tục hoặc quản lý trực tuyến, hướng dẫn bạn từng bước mà không cần phải thoát khỏi trang hoặc sao chép và dán thông tin.

Tính linh hoạt này là một trong những thế mạnh lớn nhất của Copilot Vision, cho phép nhiều đối tượng người dùng (sinh viên, chuyên gia, người cao tuổi và người dùng có nhu cầu trợ năng) tận dụng AI theo cách đơn giản và hiệu quả.

Sự khác biệt giữa phiên bản miễn phí và phiên bản Pro của Copilot Vision là gì?

Phiên bản miễn phí của Copilot Vision trên Edge đáp ứng hầu hết các nhu cầu phổ biến.nhưng Microsoft dành một số tính năng “cao cấp” cho người dùng đã đăng ký Copilot Pro.

  • Phiên bản miễn phí chỉ hoạt động trong trình duyệt Edge.. Đối với hầu hết người dùng thì như vậy là đủ vì mọi thao tác duyệt web thông thường đều được thực hiện trong cửa sổ trình duyệt.
  • Copilot Pro cho phép Vision được sử dụng ở cấp độ hệ điều hành, tích hợp với các ứng dụng bên ngoài, chương trình chỉnh sửa hình ảnh hoặc video và thậm chí cả trò chơi điện tử. Ví dụ, bạn có thể yêu cầu trợ giúp khi chỉnh sửa ảnh, xem lại tài liệu trong Word, làm việc trong Excel hoặc chơi Minecraft, tất cả đều có trợ giúp theo ngữ cảnh bên ngoài Edge.
  • Hỗ trợ nâng cao và việc sử dụng kéo dài được đảm bảo cho những người đăng ký Pro, điều này có thể tạo nên sự khác biệt trong môi trường chuyên nghiệp liên tục yêu cầu AI trên nhiều ứng dụng.

Đối với hầu hết người dùng gia đình và học sinh, trải nghiệm mà phiên bản chuẩn của Copilot Vision mang lại đã khá đầy đủ. về mặt hỗ trợ giọng nói, phân tích nội dung trực quan và trợ giúp thời gian thực.

Quyền riêng tư và bảo mật: Copilot Vision quản lý dữ liệu nào?

Quyền riêng tư là một trong những khía cạnh nhạy cảm nhất khi trí tuệ nhân tạo được sử dụng để phân tích nội dung cá nhân. Microsoft muốn nhấn mạnh đặc biệt vào điểm này:

  • Copilot Vision không lưu trữ hoặc ghi lại nội dung trang hoặc giọng nói đầu vào. trong suốt phiên họp. Tính năng này chỉ lưu lại phản hồi của trợ lý (không phải câu hỏi) và chỉ được sử dụng để cải thiện trải nghiệm sản phẩm hoặc phát hiện sự cố.
  • Hình ảnh, nội dung trực quan và âm thanh không được lưu. Khi bạn kết thúc phiên, dữ liệu đã xử lý sẽ tự động bị xóa.
  • Trước khi sử dụng tính năng này lần đầu tiên, bạn phải đồng ý rõ ràng về việc xử lý dữ liệu theo chính sách bảo mật của Microsoft.
  • Copilot Vision không thực hiện bất kỳ hành động nào trên web (nhấp chuột, nhập, cuộn) thay mặt bạn., chỉ cần chỉ tay, trả lời và đi cùng.

Điều này giảm thiểu rủi ro bị lộ hoặc sử dụng sai mục đích, cho phép người dùng tận hưởng sự tiện lợi do AI mang lại mà không phải từ bỏ quyền kiểm soát thông tin của mình.

Những hạn chế hiện tại và các khía cạnh cần cải thiện

Mặc dù có tiềm năng như vậy, công nghệ này vẫn đang trong giai đoạn cải tiến và có một số hạn chế nhất định.. Các nguồn tin từ báo chí công nghệ và cộng đồng người dùng đã chỉ ra một số lĩnh vực cần cải thiện:

  • Copilot Vision đôi khi có thể bị kẹt trong vòng lặp hoặc đưa ra phản hồi không đầy đủ., đặc biệt là trên các trang web rất phức tạp hoặc những trang web có nhiều nội dung tương tác.
  • Vẫn còn chỗ để cải thiện độ chính xác của mô tả trực quan và tương tác với tất cả các yếu tố trên màn hình.
  • Tính khả dụng có thể bị giới hạn ở một số vùng lãnh thổ hoặc ngôn ngữ nhất định tùy thuộc vào cài đặt khu vực., mặc dù Microsoft đang dần mở rộng quyền truy cập.
  • Hiệu suất thay đổi tùy theo sức mạnh của thiết bị và phiên bản trình duyệt.. Bạn nên cập nhật Edge thường xuyên và sử dụng các thiết bị mới nhất để có trải nghiệm tốt nhất.

Bất chấp những thách thức này, tiềm năng của công cụ này rất hứa hẹn và được phát triển nhanh chóng, với các bản cập nhật hàng tháng và cộng đồng tích cực báo cáo các vấn đề và đề xuất cải tiến.

Ngoài trình duyệt: tích hợp với các công cụ khác

Copilot Vision và hệ sinh thái Copilot không chỉ giới hạn ở trải nghiệm duyệt web.. Ngoài các chức năng cốt lõi, Copilot có thể tạo hình ảnh (bằng các công nghệ tiên tiến như DALL-E 2 và DALL-E 3), soạn thảo mọi loại văn bản, tóm tắt nội dung bằng các ngôn ngữ khác và giải quyết các vấn đề kỹ thuật hoặc lập trình bằng cách diễn giải trực quan các ảnh chụp màn hình.

Việc tích hợp với các ứng dụng văn phòng, email và nền tảng năng suất đặc biệt hữu ích trong môi trường làm việc và học tập, tạo điều kiện thuận lợi cho công việc hàng ngày và tối ưu hóa thời gian dành cho các công việc thường ngày.

Cách sử dụng tính năng Copilot để điều khiển điện thoại Android
Bài viết liên quan:
Cách điều khiển điện thoại Android của bạn từ PC bằng Copilot: Hướng dẫn đầy đủ

Sự tiến bộ trong tương tác kỹ thuật số này đưa chúng ta đến gần hơn với tương lai mà công nghệ sẽ trực quan và dễ tiếp cận hơn, giúp thực hiện nhiệm vụ dễ dàng hơn và cải thiện trải nghiệm của người dùng trên mọi phương diện. Chia sẻ hướng dẫn này để nhiều người dùng biết những gì họ có thể làm với Copilot Vision trong Edge..