Поддержать нас
Беларусы на войне
  1. Власти продали арестованную квартиру известного экономиста по нетипичной схеме
  2. «Мы отрежем Крым от России». Командующий Силами беспилотных систем Украины Бровди о стратегии ударов
  3. Можно ли внезапно умереть от испуга, плохих новостей или сильного стресса — рассказываем
  4. Пропагандист заявил, что 196 политзаключенных, об освобождении которых ранее не было известно, уже на свободе
  5. «Меньше кофе надо было пить, не напьетесь вы этого кофе вечно». Беларуску оставил на заправке рейсовый автобус — кто прав
  6. На авторынке «умирает» один из дилеров
  7. Возле Дроздов в Минске есть секретная многоэтажка — информации о ней минимум. Но всплыли данные об одной из квартир
  8. Беларуска назвала свою пенсию после 37 лет работы и попросила других поделиться цифрами. Суммы заметно отличаются
  9. Без Трампа, но с крупной победой. Сборная США ярко стартовала на домашнем чемпионате мира
  10. Беларусь получила щедрый «подарок» из-за границы — его масштабы впечатляют. Но такие «презенты» несут риски для нашей страны
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.