Nếu Facebook có một khẩu hiệu không chính thức, tương đương với “Đừng trở nên xấu xa” của Google hoặc “Hãy suy nghĩ khác biệt” của Apple, thì đó là “Di chuyển nhanh và phá vỡ mọi thứ”. Nó có nghĩa là, ít nhất về lý thuyết, người ta nên lặp đi lặp lại để thử những thứ tin tức và không sợ khả năng thất bại. Tuy nhiên, vào năm 2021, với phương tiện truyền thông xã hội hiện đang bị đổ lỗi cho rất nhiều tệ nạn xã hội, cụm từ có lẽ nên được sửa đổi thành: “Di chuyển nhanh và sửa chữa mọi thứ”.
Một trong những lĩnh vực truyền thông xã hội, không chỉ Facebook, đã bị ảnh hưởng bởi sự lan truyền của một số hình ảnh trực tuyến. Đó là một vấn đề đầy thách thức đối với bất kỳ trí tưởng tượng nào: Khoảng 4.000 lượt tải ảnh lên Facebook mỗi giây. Điều đó tương đương với 14,58 triệu hình ảnh mỗi giờ, hoặc 350 triệu bức ảnh mỗi ngày. Xử lý công việc này theo cách thủ công sẽ yêu cầu mọi nhân viên Facebook phải làm việc theo ca 12 giờ, phê duyệt hoặc phủ quyết một hình ảnh đã tải lên cứ sau chín giây.
Đồ họa xu hướng kỹ thuật số
Điều đó không có khả năng xảy ra sớm. Đây là lý do tại sao công việc phân loại hình ảnh được giao cho hệ thống trí tuệ nhân tạo. Một nghiên cứu mới của Facebook, được công bố hôm nay, mô tả một mô hình thị giác máy tính mới, quy mô lớn được gọi là SEER (đó là “SElf-supERvised” trong truyền thống viết tắt vô vọng mà dân công nghệ thích nắm bắt). Được đào tạo trên hơn 1 tỷ hình ảnh công khai trên Instagram, nó có thể hoạt động tốt hơn hệ thống nhận dạng hình ảnh tự giám sát tiên tiến nhất, ngay cả khi hình ảnh có chất lượng thấp và do đó khó đọc.
Đó là một sự phát triển có thể, những người tạo ra nó tuyên bố, “[mở đường] cho các mô hình thị giác máy tính linh hoạt, chính xác và thích ứng hơn”. Nó có thể được sử dụng để ngăn chặn tốt hơn “hình ảnh hoặc meme có hại khỏi nền tảng của chúng tôi.” Nó có thể hữu ích không kém khi tự động tạo hình ảnh mô tả văn bản thay thế cho người khiếm thị, phân loại tự động vượt trội các mặt hàng được bán trên Marketplace hoặc Cửa hàng trên Facebook và vô số ứng dụng khác yêu cầu cải thiện thị giác máy tính.
Chào mừng bạn đến với cuộc cách mạng tự giám sát
: “Sử dụng tính năng tự giám sát, chúng tôi có thể đào tạo trên bất kỳ hình ảnh ngẫu nhiên nào Priya Goyal , kỹ sư phần mềm tại Facebook AI Research (FAIR), nơi công ty đang thực hiện nhiều nghiên cứu nhận dạng hình ảnh sáng tạo , nói với Digital Trends . “[Điều đó] có nghĩa là, khi nội dung có hại phát triển, chúng tôi có thể nhanh chóng đào tạo một mô hình mới về dữ liệu đang phát triển và do đó, phản ứng nhanh hơn với các tình huống.”
Tính năng tự giám sát mà Goyal đề cập đến là một thương hiệu máy học đòi hỏi ít hơn trong cách nhập liệu của con người. Học bán giám sát là một cách tiếp cận học máy nằm ở đâu đó giữa học tập có giám sát và không giám sát. Trong học tập có giám sát, dữ liệu đào tạo được dán nhãn đầy đủ. Trong học tập không có giám sát, không có dữ liệu đào tạo được gắn nhãn. Trong học tập bán giám sát… tốt, bạn sẽ có được ý tưởng. Đó là, đối với học máy, điều gì để mắt đến con bạn trong khi chúng tự động tính tiền xung quanh công viên là việc nuôi dạy con cái. Học tự giám sát đã được sử dụng để tạo ra các hiệu ứng biến đổi trong thế giới xử lý ngôn ngữ tự nhiên cho mọi thứ, từ dịch máy đến trả lời câu hỏi. Bây giờ, nó cũng đang được áp dụng cho nhận dạng hình ảnh.
Chris DeGraw / Xu hướng kỹ thuật số, Hình ảnh Getty
“Học tập không giám sát là một thuật ngữ rất rộng cho thấy rằng việc học tập không sử dụng sự giám sát nào cả,” Goyal nói. “Học tập tự giám sát là một tập hợp con – hoặc trường hợp cụ thể hơn – của học tập không có giám sát, vì tự giám sát lấy các tín hiệu giám sát tự động từ dữ liệu đào tạo.”
Học tự giám sát có ý nghĩa như thế nào đối với Facebook là các kỹ sư của Facebook có thể đào tạo các mô hình trên các hình ảnh ngẫu nhiên và thực hiện nhanh chóng trong khi vẫn đạt được hiệu suất tốt trong nhiều nhiệm vụ.
Goyal nói: “Có thể đào tạo trên bất kỳ hình ảnh internet ngẫu nhiên nào cho phép chúng tôi nắm bắt được sự đa dạng về hình ảnh của thế giới. “Mặt khác, học có giám sát yêu cầu chú thích dữ liệu, điều này hạn chế sự hiểu biết trực quan về thế giới vì mô hình được đào tạo để chỉ học các khái niệm được chú thích bằng hình ảnh rất hạn chế. Ngoài ra, việc tạo tập dữ liệu có chú thích giới hạn lượng dữ liệu mà hệ thống của chúng tôi có thể được đào tạo, do đó, các hệ thống được giám sát có thể sẽ bị sai lệch hơn. ”
Điều này có nghĩa là các hệ thống AI có thể học hỏi tốt hơn từ bất kỳ thông tin nào chúng được cung cấp mà không cần phải dựa vào các bộ dữ liệu được quản lý và gắn nhãn để dạy chúng cách nhận ra các đối tượng cụ thể trong một bức ảnh. Trong một thế giới phát triển nhanh như thế giới trực tuyến, đó là điều cần thiết. Nó có nghĩa là nhận dạng hình ảnh thông minh hơn, hoạt động nhanh hơn.
Các ứng dụng khả thi khác
“Chúng tôi có thể sử dụng các mô hình tự giám sát để giải quyết các vấn đề trong các lĩnh vực có dữ liệu rất hạn chế hoặc không có siêu dữ liệu, chẳng hạn như hình ảnh y tế Goyal cho biết: . “Có thể đào tạo các mô hình chất lượng cao, tự giám sát chỉ từ các hình ảnh ngẫu nhiên, không gắn nhãn và không bão hòa, chúng tôi có thể đào tạo các mô hình trên bất kỳ hình ảnh internet nào và điều này cho phép chúng tôi nắm bắt sự đa dạng của nội dung trực quan và giảm thiểu các thành kiến do quản lý dữ liệu. Vì chúng tôi không yêu cầu nhãn hoặc quản lý dữ liệu để đào tạo một mô hình tự giám sát, chúng tôi có thể nhanh chóng tạo và triển khai các mô hình mới để giải quyết vấn đề ”.
Như với tất cả các công việc của FAIR, hiện tại điều này chắc chắn đang trong giai đoạn nghiên cứu, chứ không phải là công nghệ sẽ ra mắt trên nguồn cấp dữ liệu Facebook của bạn trong vài tuần tới. Điều đó có nghĩa là điều này sẽ không được triển khai ngay lập tức để giải quyết vấn đề hình ảnh độc hại lan truyền trên mạng. Đồng thời, điều đó có nghĩa là các cuộc trò chuyện về việc sử dụng AI để xác định thêm các chi tiết nhỏ trong hình ảnh tải lên là quá sớm.
Dù muốn hay không, các công cụ AI phân loại hình ảnh ngày càng thông minh hơn. Câu hỏi lớn là liệu chúng có được sử dụng để phá vỡ mọi thứ thêm hay bắt đầu sửa chữa chúng sao lưu lại.
Nguồn: DigitalTrends
