Profile avatar
dalekiy-obriy.bsky.social
Вуйко з LanguageTool'у
42 posts 11 followers 13 following
Regular Contributor
Conversation Starter

Stepping on the same rake? 1938

🎓Сучасний стан української NLP🎓 Запрошуємо вас взяти участь у науковому семінарі, присвяченому сучасному стану обробки природної мови (NLP) для української мови. У рамках заходу провідна фахівчиня комп'ютерна лінгвістка Мар'яна Романишин ознайомить з ключовими досягнення в галузі в Україні.

Вийшла стаття В. Старка «Проблемні випадки творення фемінітивів у корпусі й словнику»

Вийшла версія 6.5.4 Великого електронного словника української мови (ВЕСУМ). В цій версії: * узгоджено назви нас.п. з останньою версією КАТОТТГ, зокрема додано назви нас.п., що з'явилися у зв'язку з декомунізацією * додано нові слова

One of the few things that Trump and Vance are clearly campaigning on is lawlessness, breaking the rule of law and ignoring the constitution. Beyond the fundamental issue of the rule of law, Trump and Vance's announced plans spell economic disaster for the United States. youtu.be/872d8Fa6pNs

Вийшов #LanguageTool 6.5 Нове в українському модулі: * понад 2,5 тис. нових слів * нові граматичні та стильові правила * покращення токенізації та тегування

Вийшов ВЕСУМ 6.5.3: * понад 425283 лем, з яких генеруються понад 6,5 млн словоформ (з них понад 3,690 млн унікальних) * варіанти заміни для понад 9260 покручів і небажаних слів * інформація про керування відмінками * інформація про абревіатури, сленгові, рідковживані слова тощо

У корпусі БрУК вже 600 тис. українських слів зі знятою омонімією! 600130 Ukrainian tokens 746845 total tokens 608782 word/number tokens 601970 alpha word tokens 103781 unique Ukrainian words 95534 unique Ukrainian words (case-insensitive) 44179 unique lemmas

Ми покращили правило узгодження числівників та іменників, додали декілька нових правил, та поповнили словник. Як завжди будемо вдячні за зворотний зв'язок.

Думки й підхід (здоровий пуризм) з цієї статті суголосні нашому підходу в правописнику #LanguageTool. zbruc.eu/node/104522

Ми додали декілька нових правил у Правописник #LanguageTool, зокрема для: * складати більшість/меншість * заставляти і примушувати * розхідна частина * кінець кінців * пам'ятник чого * складова -> складник * вживати заходи Також ми покращили охоплення деяких інших правил та поповнили словник.

На форумі r2u відбувається обговорення зауваг та пропозицій до правопису 2019 р. (r2u.org.ua/forum/viewto...) Інститут української мови отримає ці зауваги 31 серпня. Долучайтеся до обговорення.

З усіх словників словозміни лише ВЕСУМ розпізнає граматичні ознаки всіх трьох слів у цьому заголовку, взятому з Кобзаря. Бо лише ВЕСУМ подає форми кличного відмінка для прикметників і присвійних займенників та містить нестягнені форми прикметників: вечірняя, всеплодющая… zbruc.eu/node/118759

www.bloomberg.com/news/article... Час Європі взятися за цей канал пропаганди.

Вийшов #LanguageTool 6.4 Нове в українському модулі: * понад 3 тис. нових слів * нові граматичні та стильові правила * покращення токенізації та тегування

Ловимо нове в LanguageTool: * були повністю завершенні роботи * було анкетовані біля 20 школярів * — йдеться повідомленні * в яку входить експерти Альянсу * підготовка видання була підтримане * підсвічуватися природнім світлом * хто повірив більшовиками * порушувались карантині заходи

Ми додали декілька правил для нарощування числівників. На жаль логіка не проста, і лише декілька моментів регулюється чинним правописом. Тому ми розбили правила на ті, що йдуть за правописом і ті що йдуть за рекомендаціями мовознавців.

Ми додали декілька нових правил для сполук з «пред'явити» та «точка зору». Дякуємо Редакторка Юлія Мороз за ідею.

Ми прикрутили гайки прийменнику «з» і тепер ловимо такі помилки: * менеджера з продаж * злетіли з погон * судно з берести * гол з ігри * з моє співробітницею * боротьбу з корупцію * З точку зору економіки * отримані з продажі * скандал з реалізацію неякісних вакцин

LibreOffice.org >= 7.4 має вбудовану підтримку віддаленого LanguageTool. Тож встановлювати розширення потрібно лише, якщо потрібно: * працювати без з'єднання з інтернетом * потрібна перевірка документів Impress та Calc * потрібна гнучка система опцій

Народний англо-український словник на сайті e2u.org.ua вже налічує понад 4 700 статей. Cловник поповнюється на основі ваших запитів, що не охоплені іншими словниками, і на основі пропозицій на форумі. Будемо за відгуки, пропозиції, та навіть просто пошукові запити.

Ми додали в правописник #LanguageTool близько десяти нових правил, зокрема для: * будь то * на Україні * відтік капіталу * диву даватися * допустити помилку Як завжди, будемо вдячні за відгуки та пропозиції

Матриця частот сполучуваності літер в українських словах з корпусу БрУК (* - початок/кінець слова)

Вийшла версія 6.3.1 Великого електронного словника української мови (ВЕСУМ). В цій версії: * понад 500 нових слів Слова зі словника можна шукати через вебінтерфейс: vesum.nlp.net.ua Сторінка проєкту: github.com/brown-uk/dic...

Ми додали в правописник #LanguageTool декілька нових правил: * користуватися довірою -> мати довіру * Між тим (на початку речення) -> тим часом, проте * на днях -> днями Як завжди будемо вдячні за зворотний зв'язок.