Міністр цифрової трансформації Михайло Федоров розповів деталі розробки української великої мовної моделі, яка навесні 2026 року має вийти в бета-тестування.Міністр цифрової трансформації Михайло Федоров розповів деталі розробки української великої мовної моделі, яка навесні 2026 року має вийти в бета-тестування.

«Триває найважливіша частина роботи». Федоров розповів на якому етапі розробки перебуває національна LLM

2026/01/07 22:23

«Триває найважливіша частина роботи». Федоров розповів на якому етапі розробки перебуває національна LLM

Міністр цифрової трансформації Михайло Федоров розповів деталі розробки української великої мовної моделі, яка навесні 2026 року має вийти в бета-тестування.

Залишити коментар

Міністр цифрової трансформації Михайло Федоров розповів деталі розробки української великої мовної моделі, яка навесні 2026 року має вийти в бета-тестування.

Федоров нагадав, що технічним партнером проєкту є компанія «Київстар», яка фінансує розробку національної LLM, а потім передасть її державі. Вона базується на сімействі моделей Gemma від Google, які адаптують під українську мову та контекст. 

Якість розробки національної LLM тестуватиме група незалежних експертів з різних галузей, яка перевірятиме модель на: 

  • технічну якість;
  • етичність і безпечність для користувачів;
  • знання української мови; 
  • розуміння національного контексту.

«Нині триває найважливіша частина роботи — збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами й іншими інституціями — це терабайти унікальних даних», — повідомив Михайло Федоров.

Він додав, що паралельно створюється юридичний фреймворк, щоб «відповідально працювати з даними, які надають для тренування моделі». 

За словами очільника Мінцифри, група експертів уже працює над створенням бенчмарків, які допоможуть оцінювати й покращувати якість національної LLM. Це дасть змогу тримати у фокусі ефективність та безпеку мовної моделі. 

У січні також вже буде готова перша база текстів для тренування LLM та покращений токенізатор — інструмент, який розділяє слова на елементи, щоб LLM обробляла мову швидше та продуктивніше. Також цього місяця стартує голосування за назву української LLM.

Нагадаємо, що наміри Мінцифри створити власний штучний інтелект, який розумітиме українців краще за ChatGPT, на початку викликали тільки подив та усмішки, але від слів до реальних дій пройшло лише кілька місяців. dev.ua розбирався, навіщо Україні потрібна власна LLM.

Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Мінцифри й «Київстар» обрали ШІ-модель, на якій тренуватимуть національну LLM
По темi
Мінцифри й «Київстар» обрали ШІ-модель, на якій тренуватимуть національну LLM
Мінцифри й «Київстар» шукають назву для національної LLM: за найкращі ідеї можна отримати призи. Через годину після анонсу від українців уже сотні варіантів
По темi
Мінцифри й «Київстар» шукають назву для національної LLM: за найкращі ідеї можна отримати призи. Через годину після анонсу від українців уже сотні варіантів
Українські дослідники представили Lapa LLM — першу національну ШІ-модель для міркування
По темi
Українські дослідники представили Lapa LLM — першу національну ШІ-модель для міркування
Залишити коментар
Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою service@support.mexc.com для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.