Кубинские ученые создали собственную языковую ИИ-модель
Кубинские исследователи из Гаванского университета создали уникальную языковую модель искусственного интеллекта, специально адаптированную к особенностям испанского языка, присущим на Кубе.
Эта модель, названная CecilIA, стала первой в Латинской Америке ИИ-моделью, обученной на национальной языковой базе. Профессор факультета математики и вычислительной техники Александр Пьяд поделился этой новостью в интервью РИА Новости.
По словам Пьяда, CecilIA уже обучена уникальным языковым особенностям, характерным именно для кубинского испанского, что делает ее особенно эффективной для работы с текстами на этом диалекте. Этот значимый шаг в развитии искусственного интеллекта открывает новые перспективы для использования подобных моделей в различных областях, включая образование, медицину и бизнес.Исследователи надеются, что CecilIA станет не только инструментом для обработки текстов на кубинском испанском, но и позволит углубить понимание особенностей этого языка и его культурного контекста. Внедрение таких инновационных технологий способствует развитию лингвистики и информационных технологий в регионе, открывая новые горизонты для сотрудничества и обмена знаниями.Начиная с момента стажировки исследователей в Университете Аликанте в Испании, идея проекта начала принимать форму. В марте было принято решение начать сбор корпуса текстов для обучения модели, и уже в апреле было обработано около 300 тысяч документов - что составляет 300 миллионов слов из различных кубинских источников, включая газеты, книги и песни. Основой для создания модели стала Salamandra 2B, открытая академическая разработка Барселонского центра суперкомпьютеров.По словам Пьяд, "Для создания языковой модели, даже самой небольшой, Кубе не хватало необходимого оборудования. До недавнего времени не существовало технологий, позволяющих реализовать проект с минимальными аппаратными ресурсами". Именно поэтому исследователи приняли решение использовать испанские разработки в качестве основы для своего проекта.Этот проект не только открывает новые горизонты для лингвистики и технологий на Кубе, но также демонстрирует важность международного сотрудничества в научных исследованиях. В результате усилий исследователей, теперь кубинские специалисты имеют доступ к современным методам обработки текста и анализа данных, что способствует развитию научного сообщества страны.Кубинская модель CecilIA, названная в честь главной героини романа "Сесилия Вальдес" Сирило Вильяверде, не только символизирует культурное и расовое наследие Кубы, но и отражает его в цифровом мире. Это не просто игра слов, а глубокий поклон истории и традициям острова.
Юдивиан Альмейда, директор Группы исследований искусственного интеллекта факультета математики, подчеркнул, что CecilIA предоставляет возможность создания разнообразных приложений, включая чат-боты вроде ChatGPT, способных загружать документы и проводить поиск информации в сети. Эта модель способна понимать и генерировать ответы на испанском языке с акцентом на кубинскую его вариацию.
Создание CecilIA открывает новые перспективы для развития искусственного интеллекта с учетом культурных особенностей. Ее потенциал в области обработки естественного языка и взаимодействия с пользователем на уровне, близком к реальному, делает эту модель уникальной и перспективной для многочисленных областей применения.
Альмейда пояснил, что важно, чтобы модель учитывала не только язык, но и культурные, социальные, лингвистические особенности Кубы - местные выражения, идиомы, культурные отсылки. Это позволит создать более адаптированную и понятную систему общения для пользователей.План разработчиков включает завершение второй фазы обучения - "инструктивную настройку" - к концу 2025 года. На этом этапе модель будет обучена выполнять задания, принимать роли, отвечать на вопросы и вести полноценный диалог. Это значительный шаг в развитии искусственного интеллекта, который позволит модели лучше взаимодействовать с пользователями.Учитывая сложность задачи, команда разработчиков уделяет особое внимание адаптации модели к уникальным особенностям кубинской культуры. Это позволит создать более глубокое и эмоциональное взаимодействие между человеком и искусственным интеллектом, открывая новые возможности для развития технологий и общения.Источник и фото - ria.ru