Latam-GPT là mới Mô hình ngôn ngữ lớn được phát triển trong và cho Mỹ Latinh. Dự án, dẫn đầu bởi Trung tâm Trí tuệ Nhân tạo phi lợi nhuận Chile (CENIA), nhằm mục đích giúp khu vực đạt được sự độc lập công nghệ bằng cách phát triển mô hình AI nguồn mở được đào tạo về ngôn ngữ và bối cảnh Mỹ Latinh.
Công việc này không thể được thực hiện bởi chỉ một nhóm hoặc một quốc gia ở Mỹ Latinh: đó là một thách thức đòi hỏi sự tham gia của mọi người. Một dự án tìm cách tạo ra một mô hình AI hợp tác mở, miễn phí và trên hết.
Dự án nổi bật cho tinh thần hợp tác của nó. Chúng tôi không tìm cách cạnh tranh với Openai, Deepseek hoặc Google. Chúng tôi muốn một mô hình cụ thể cho Mỹ Latinh và Caribbean, nhận thức được các yêu cầu và thách thức về văn hóa mà điều này đòi hỏi, như hiểu các phương ngữ khác nhau, lịch sử của khu vực và các khía cạnh văn hóa độc đáo, ông giải thích.
Nhờ 33 quan hệ đối tác chiến lược với các tổ chức ở Mỹ Latinh và Caribbean, dự án đã thu thập được một kho dữ liệu vượt quá tám terabyte văn bản, tương đương với hàng triệu cuốn sách. Cơ sở thông tin này đã cho phép phát triển một mô hình ngôn ngữ với 50 tỷ tham số, một thang đo làm cho nó có thể so sánh với GPT-3.5 và cung cấp cho nó một khả năng trung bình đến cao để thực hiện các nhiệm vụ phức tạp như lý luận, dịch thuật và liên kết.
Latam-GPT đang được đào tạo trên cơ sở dữ liệu khu vực tổng hợp thông tin từ 20 quốc gia Mỹ Latinh và Tây Ban Nha, với tổng số 2.645.500 tài liệu ấn tượng. Việc phân phối dữ liệu cho thấy sự tập trung đáng kể ở các quốc gia lớn nhất trong khu vực, với người lãnh đạo Brazil với 685.000 tài liệu, tiếp theo là Mexico với 385.000, Tây Ban Nha với 325.000, Colombia với 220.000 và Argentina với 210.000 tài liệu. Các con số phản ánh quy mô của các thị trường này, sự phát triển kỹ thuật số của chúng và sự sẵn có của nội dung có cấu trúc.
Ban đầu, chúng tôi sẽ ra mắt một mô hình ngôn ngữ. Chúng tôi hy vọng hiệu suất của nó trong các nhiệm vụ chung sẽ gần với các mô hình thương mại lớn, nhưng với hiệu suất vượt trội trong các chủ đề cụ thể đối với Mỹ Latinh. Ý tưởng là, nếu chúng tôi hỏi về các chủ đề liên quan đến khu vực của chúng tôi, kiến thức của nó sẽ sâu sắc hơn nhiều.
Mô hình đầu tiên là điểm khởi đầu để phát triển một gia đình các công nghệ tiên tiến hơn trong tương lai, bao gồm các công nghệ có hình ảnh và video và để mở rộng các mô hình lớn hơn. Vì đây là một dự án mở, chúng tôi muốn các tổ chức khác có thể sử dụng nó. Một nhóm ở Colombia có thể điều chỉnh nó cho hệ thống giáo dục của trường hoặc một ở Brazil có thể thích nghi cho ngành y tế.
