[Inforgraphic] Các trang web được AI trích dẫn nhiều nhất
| 10 Chatbot AI được sử dụng nhiều nhất năm 2025 Liệu AI có thay thế việc làm? |
![]() |
Các mô hình ngôn ngữ lớn (LLM) như ChatGPT lấy thông tin từ đâu?
Infographic này xếp hạng các trang web được AI trích dẫn nhiều nhất, dựa trên phân tích hơn 150.000 trích dẫn LLM vào tháng 6/2025. Thông tin này cho thấy mức độ chatbot phụ thuộc vào nội dung do người dùng tạo ra, từ đó đặt ra câu hỏi về những điểm mù của các công cụ AI hàng đầu hiện nay.
Dữ liệu và phân tích
Dữ liệu phân tích này đến từ Semrush. Nó cho thấy tần suất các mô hình AI trích dẫn các lĩnh vực khác nhau khi cung cấp thông tin, tính đến tháng 6/2025.
| Thứ hạng | Tên miền | Tần suất trích dẫn |
| 1 | reddit.com | 40,1% |
| 2 | wikipedia.org | 26,3% |
| 3 | youtube.com | 23,5% |
| 4 | google.com | 23,3% |
| 5 | yelp.com | 21,0% |
| 6 | facebook.com | 20,0% |
| 7 | amazon.com | 18,7% |
| 8 | tripadvisor.com | 12,5% |
| 9 | mapbox.com | 11,3% |
| 10 | openstreetmap.com | 11,3% |
| 11 | instagram.com | 10,9% |
| 12 | mapquest.com | 9,8% |
| 13 | walmart.com | 9,3% |
| 14 | ebay.com | 7,7% |
| 15 | linkedin.com | 5,9% |
| 16 | quora.com | 4,6% |
| 17 | homedepot.com | 4,6% |
| 18 | yahoo.com | 4,4% |
| 19 | target.com | 4,3% |
| 20 | pinterest.com | 4,2% |
Rủi ro khi dựa vào Nội dung do Người dùng tạo ra
Reddit dẫn đầu danh sách với tần suất trích dẫn là 40,1%, tiếp theo là Wikipedia với 26,3%. Điều này cho thấy các LLM thường xuyên dựa vào các cuộc thảo luận trên diễn đàn mở và nội dung do cộng đồng duy trì làm trích dẫn.
Các lĩnh vực này cung cấp rất nhiều kiến thức do người dùng tạo ra, nhưng bản chất biên tập mở của chúng làm dấy lên lo ngại về tính chính xác và thiên vị. Sự phụ thuộc cao độ này cho thấy AI có thể khuếch đại bất kỳ câu chuyện nào được nhìn thấy nhiều nhất hoặc được thảo luận phổ biến nhất - ngay cả khi nội dung đó chưa được xác minh.
Ví dụ: người dùng đã báo cáo rằng ChatGPT đã gợi ý họ lọc nước bằng thuốc tẩy, hoặc thậm chí trộn nước với giấm (điều này tạo ra khí clo độc hại).
Có ba rủi ro chính khi dựa vào nội dung do người dùng tạo ra dưới đây:
- Thông tin sai lệch và lan truyền tin đồn: Vì nội dung không phải lúc nào cũng được kiểm duyệt bởi các chuyên gia trong lĩnh vực, AI có thể vô tình lặp lại các tuyên bố không chính xác hoặc thiên vị.
- Phó đại thông tin: Các câu chuyện phổ biến nhưng chưa được xác minh có thể được lặp lại nếu chúng thu hút được sự chú ý của người dùng, che giấu các nguồn ít được nhìn thấy hơn nhưng chính xác hơn.
- Thiếu thẩm quyền: Đặc biệt đối với các chủ đề quan trọng như (sức khỏe, luật pháp, tài chính), các trang web do người dùng tạo ra thiếu sự giám sát biên tập cần thiết để có được hướng dẫn đáng tin cậy.
Tin liên quan
Tin khác
Những thói quen buổi sáng làm giảm lượng vitamin B12 trong cơ thể
Những sai lầm lớn nhất khi chống đẩy khiến chúng trở nên vô dụng
Camera AI trở thành “mắt thần” điều hành giao thông Hà Nội
7 dấu hiệu cảnh báo bạn đang thiếu kẽm
Uống gì vào buổi sáng sớm để có mái tóc khỏe mạnh và bóng mượt?
Những thực phẩm tuyệt đối không được ăn sống
5 loại thức uống chống lão hóa tự nhiên giúp nuôi dưỡng từ bên trong
UEH đồng hành kiến tạo tương lai, sức khỏe nghề nghiệp và phúc lợi việc làm
Hợp tác giữa Sở Khoa học và Công nghệ TP.HCM và “kỳ lân” công nghệ Canva thúc đẩy chuyển đổi số toàn diện

![[Inforgraphic] Các trang web được AI trích dẫn nhiều nhất [Inforgraphic] Các trang web được AI trích dẫn nhiều nhất](https://thoibaonganhang.vn/stores/news_dataimages/2025/092025/05/16/most-cited-websites-by-ai-web-recovered20250905160154.jpg?rt=20250905160159)

