80 лет Великой Победе!

Кубинские ученые создали собственную языковую ИИ-модель

Профессор факультета математики и вычислительной техники Александр Пьяд поделился с РИА Новости этой важной новостью.

Созданная модель искусственного интеллекта, названная CecilIA, уже обучена уникальным особенностям кубинского испанского. Это первая в Латинской Америке модель ИИ, обученная на языковой базе конкретной страны, что делает ее особенно ценной для местных потребностей и задач.

Разработка такой инновационной технологии открывает новые возможности для использования искусственного интеллекта в различных областях, от образования до бизнеса. Это также подчеркивает важность адаптации технологий к конкретным культурным и языковым контекстам для более эффективного взаимодействия с пользователем.

Идея проекта возникла после стажировки исследователей в Университете Аликанте в Испании. В марте они начали собирать корпус текстов для обучения модели, а в апреле обработали около 300 тысяч документов - 300 миллионов слов из кубинских газет, книг, песен и других источников. В основе модели - Salamandra 2B, открытая академическая разработка Барселонского центра суперкомпьютеров.

Для создания языковой модели, даже самой маленькой, на Кубе до недавнего времени не хватало не только необходимого оборудования, но и технологий. Именно поэтому исследователи приняли решение использовать испанские разработки в качестве основы для своего проекта.

"Оборудование, необходимое для создания языковой модели, даже самой маленькой, на сегодняшний день недоступно для Кубы. До недавнего времени попросту не существовало технологий, которые позволяли бы реализовать такой проект с минимальными аппаратными ресурсами", - пояснил Пьяд решение исследователей принять за основу испанские разработки.

В современном мире все больше внимания уделяется разработке инновационных технологий, которые отражают культурное наследие различных стран. Одним из примеров таких технологий является кубинская модель, названная в честь главной героини известного романа "Сесилия Вальдес" Сирило Вильяверде. Это не просто игра слов, а глубокая отсылка к культурным и расовым особенностям Кубы, которые теперь отражаются в цифровом пространстве.

На базе CecilIA возможно создание разнообразных приложений, включая чат-боты вроде ChatGPT, способных загружать документы и искать информацию в интернете. Директор Группы исследований искусственного интеллекта факультета математики, Юдивиан Альмейда, подчеркнул, что CecilIA способна понимать и генерировать ответы на испанском языке с акцентом на кубинскую его разновидность. Это открывает новые возможности для развития искусственного интеллекта с учетом культурных особенностей.

Исследование направлено на создание модели, способной учитывать не только языковые особенности, но и различные аспекты культуры, общества и лингвистики Кубы, такие как местные выражения, идиомы и культурные отсылки, как пояснил Альмейда. Вторая фаза обучения, названная "инструктивной настройкой", планируется завершить к концу 2025 года. На этом этапе модель будет обучена выполнять задания, принимать определенные роли, отвечать на вопросы и вести продуктивный диалог.

Источник и фото - ria.ru