Д.Батмөнх: Цаашид үсгийн биш утгын алдааг хянадаг болох хэрэгтэй

2021-08-02
Нийтэлсэн: Админ
 11 мин унших

Д.ОЮУНЧИМЭГ

“Зууны мэдээ” сонин салбар салбарын тэргүүлэгчид, шинийг санаачлагчдыг “Leaderships forum” буландаа урьж  Монгол Улсын хөгжлийн гарц, боломжийн талаар ярилцаж тэдний сонирхолтой шийдэл, санаануудыг уншигчиддаа хүргэдэг билээ. Энэ удаа “Хиймэл оюун ухаан хөгжүүлэгчдийн Монголын холбоо” төрийн бус байгууллагыг үүсгэн байгуулагч Д.Батмөнхийг урьж ярицлаа.

 

МОНГОЛ ҮГИЙН АЛДАА ШАЛГАХ БОЛОМЖИЙГ СУДАЛСАН

 

-2001 онд математикийн номын эх бэлтгэх явцад нэг үгийг олон янзаар бичиж байсныг анзаарсан юм. Тэгээд л эх бэлтгэх программууд дээр монгол үгийн алдаа шалгах боломжийг судалж эхэлсэн. Номын эхээ бэлтгэж дуусмагцаа математикийн нэр томьёо зонхилсон хоёр сая гаруй үгийн сан бүрдүүлсэн.

Мэдээж өөрийн олж авсан туршлагаа бусадтай хуваалцах үүднээс толио ЛаТеХ хэрэглэгчдийн мэдэх winedt.org сайтад байршуулж, удаа дараа сайжруулалт хийсэн. Түүнчлэн aspell.net сайтын 10 орчим мянган үгийн сантай монгол толийн үгийн санг хоёр сая болгосон юм шүү дээ. Хамгийн гол нь нийтийн бичгийн боловсролын түвшнийг, хэл шинжлэл болон байгалийн ухааны салбарын уялдаа холбоог сайжруулсны үндсэн дээр дээшлүүлэх санаагаа төсөл болгон боловсруулсан юм.

Анх толио, үгийн алдаа засдаг программууд дээр туршсан. Үүний дараа эрдэмтдийн багтай хамтарч ажиллан албан ёсных болгох ёстой гэж үзсэн. Мэдээж би ганцаараа эрдэмтдийг цуглуулж ажиллуулах боломжгүй. Хамгийн наад зах нь цалин хөлсний асуудлаас эхлээд бэрхшээл тулгарч байгаа юм. Тиймээс төсөл болгож төрийн байгууллага, тэр дундаа Засгийн газарт хандах хэрэгтэй гэж бодсон. Төрийн байгууллага байх ёстой вэ гэвэл энэ программаар ашиг олох боломжгүй учраас хувийн хэвшил дэмжихгүй. Тийм болохоор нийтээр нь цэгцлэхийн тулд Засгийн газартай хамтарч ажиллах нь зүйтэй гэж үзсэн хэрэг. Ерөнхийлөгч болон Засгийн газарт удаа дараа хүсэлт хүргүүлсэн боловч эцэстээ өөрийн санаагаа алдсан.

 

КОМПЬЮТЕРТ ЭХ БЭЛТГЭХЭД АЛДААГ АВТОМАТААР ЗАСДАГ ПРОГРАММ БАЙХ ЁСТОЙ

 

-Анх Засгийн газарт хандахад Боловсролын яам руу шилжүүлсэн байдаг юм. Тухайн үед Боловсролын сайд нь Ё.Отгонбаяр байсан. Тэр үед намайг оюутан байсан болохоор төдийлөн тоогоогүй байх. Тэд, хэдэн сарын дараа 700 үгийг журамлах тогтоол гаргасан байдаг. Гэхдээ миний дэвшүүлсэн санааны гол зорилго нь огт биш. Хэдэн үгийг зөв бичих тухай тогтоол гаргаад түүнийг нь хүмүүс цээжлээд зөв бичдэг болчихгүй л дээ.

Компьютерт эх бэлтгэхэд алдааг автоматаар засдаг программ байх ёстой. Мэдээж явуулах газар нь Боловсролын яам. Дахиад л гацна. Ингэж явсаар Н.Алтанхуягийн Засгийн газарт хүсэлтээ хүргүүлж байлаа. Мэдээж тодорхой хугацаа өнгөрсөн учраас  төслөө илүү сайжруулсан байсан. Ингээд санхүүжилтийг нь шийдвэрлэж хэрэгжүүлэх ажлыг өнөөх л Боловсролын яам руугаа шилжүүлсэн байдаг юм.

Мэдээж би Төрийн хэлний зөвлөлд хандаж өөрийн санал хүсэлтийг танилцуулж байсан. Тэд манай багт орж ажиллахыг дэмжинэ гэдгээ илэрхийлж байсан. Би шат шатны байгууллагад хандаж байх үедээ төслөө сайжруулахын сацуу “Төрийн Хэлний Зөвлөл”, “Хэл зохиолын хүрээлэн”, МУИС болон МУБИС гэсэн байгууллагуудаас хэл шинжлэлийн болон бусад салбарын эрдэмтэн багш нарыг оролцуулахаар төлөвлөж байсан. Уг төслийг хэрэгжүүлснээр одоо мөрдөж байгаа эрдэмтэн Ц.Дамдинсүрэн нарын “Монгол үсгийн дүрмийн толь”-ийг сайжруулж, хэлзүйн хувьд шийдэгдээгүй асуудлуудыг судалж цэгцлэх, түүнчлэн байгалийн ухааны салбарт түгээмэл хэрэглэгддэг гадаад үгийг шүүж, монголчилж болох үгсийг шинээр үгийн санд нэмэх, мөн олон нийтээс шинэ үг санал болгох боломжийг бүрдүүлсэн монгол-монгол, монгол-англи гэсэн кирилл, латин, уйгур тайлбар болон үгийн хувиллыг агуулсан цахим толь бичиг, өргөн хэрэглээний программуудад зориулсан монгол үгийн алдаа шалгах толь зэргийг бүтээж нийтэд үнэ төлбөргүй ашиглуулах саналтай байсан юм.

Тэд эцсийн хариу өгөлгүй удсаны эцэст хэвлэл мэдээллийн хэрэгслээр Монгол Улсын Ерөнхийлөгч Цахиагийн Элбэгдоржийн санаачилга, Ерөнхийлөгчийн Тамгын газрын дэмжлэгээр Шинжлэх ухааны академийн Хэл зохиолын хүрээлэн, Физик технологийн хүрээлэнгийн Информатикийн салбарын судлаачид “Монгол хэлний их тайлбар толь”-ийг бүтээсэн талаар мэдээлсэн.

Гэвч хамгийн гол асуудал болох толь бичиг дэх кирилл үгийн хувилал болон өргөн хэрэглээний программд үнэ төлбөргүй ажиллах алдаа шалгагчийг шийдэлгүй орхисон. Зөвхөн өнөөдрийг аргацаах төдийхнөөр хэмжигдэх асуудал биш. Өөртөө нэр хүнд олох зорилгоор хэрэгжүүлдэг ажил ч биш. Магадгүй анхлан санаачлагчийн хувьд хууртаад өнгөрөх эсвэл мэдээгүй юм шиг өнгөрөөх асуудал биш л дээ.

 

ҮГИЙН АЛДАА ЗАСДАГ ПРОГРАММ, ҮГИЙГ ЗӨВ БИЧИХ ТОЛИЙГ БУРУУ ХИЙХ УЧИРГҮЙ

 

Гэрэл зургийг Б.Оюунзул

-Монгол Улсын тухайд зохиогчийн эрхийн асуудал байнга хөндөгдөж, орхигдож байдаг. Хожим Монгол хэлний зөв бичих дүрмийн журамласан толь toli.gov.mn гаргаж кирилл үсгээр үгийн хувиллыг тольдоо тусгаж, анх дэвшүүлж байсан санаа, бичиж өгсөн төслийг маань хагас дутуу ч атугай хэрэгжүүлсэн байна лээ. Үүгээр асуудлыг бүрэн шийдэхгүй. Сонирхолтой нь шийдэгдээгүй үлдсэн, үгийн алдаа шалгах асуудлыг “Мэдээллийн технологи, шуудан, харилцаа холбооны газар” шийдсэн болж, spellcheck.gov.mn сайтаараа дамжуулан олон нийтэд зарлахдаа, олон жилийн тэртээ С.Бадрал гэдэг залуугийн бэлтгэж байсан арван мянган үгийн сантай тольд өөрийн бэлтгэсэн үгийн сангаа нэмүүлж хоёр сая үгийн сантай болгуулж байсан нээлттэй эхэд суурилсан, ердөө туршилт төдий толийг нээлттэй эхийн лицензийн журмыг зөрчин байж, хэрэглэгчдэд ил харагдах ёстой зохиогчдын мэдээллийг далдлан байж гаргасан байсан. Үнэндээ тус байгууллагад өмнө нь бас л төслөө танилцуулж байсан юм. Харамсалтай нь дахиад хэдэн сарын дараа гэнэт харилцаа холбооны зохицуулах хорооноос үнэгүй үгийн алдаа засах программ гаргасан байгаа юм. Тэр программ нь одоо ч гэсэн ажиллаж байгаа шүү дээ. Нэлээн өндөр хандалттай байдаг юм. Хамгийн гол нь туршилтын хувилбар ашигласан учраас тус газраас гаргасан программ алдаатай. Тэр ч бүү хэл журамласан толь ч алдаатай. Тиймээс эрдэмтдийн багаар нь хүлээн зөвшөөрүүлээд албан ёсны баталгаатай болсон хойно нь нийтэд түгээе. Ингэхдээ толь бичиг, алдаа засдаг программ нь хамт байх ёстой гэж төлөвлөсөн. Гэтэл хоноцын сэтгэлгээгээр хандаж байгаад нь бухимдаж байна. Энэ бол зөвхөн намайг хуурч байгаа зүйл биш. Журамласан толь маш их алдаатай. Ямар алдаа байна гэхээр уг толийг олон хүн хувааж бэлтгэсэн байгаа юм. Учир нь ижил хувилалтай үгсийг алдаатай, алдаагүй хувилгасан байсан. Толь дүрмийн болоод бичлэгийн хувьд алдаагүй байх ёстой. Тэгтэл дүрмийн болоод бичлэгийн хувьд алдаатай байна. Эхлээд би дүрмийн алдааг нь хэлье. Жишээлбэл, “утаст” гэсэн үг бий. Гэтэл журамласан тольд “утасд” гэж бичсэн. “С”-ын ард “Д”-г бичихдээ эгшиггүй бичиж болохгүй. Энэ бол дүрмийн алдаа. Учир нь хоёр заримдаг гийгүүлэгч дундаа эгшиг бичигдэх дүрэмтэй. Гэтэл үүнтэй төстэй зарим үгс нь зөв бичигдсэн байгаа юм. Харин бичлэгийн алдааны тухайд гэвэл, кирилл үсгийн дүрмийг зохиосон эрдэмтэн Ц. Дамдинсүрэнгийн, төвшин, түвшин гэдгийг төвшин болгож, дэгдээхэй, эрвээхэй гэж “эй” дагавартай хэлдгийг гажилт гэж үзэж дэгдээхий, эрвээхий болгож журамласныг хэрэгсэхгүй болгосон.

Хэдийгээр би монгол хэлний мэргэжлийн хүн биш ч гэсэн 10 жил энэ чиглэлээр ажиллаж байна. Ээж маань монгол хэлний багш болохоор мэргэжлийн хүнээс дутахааргүй суурьтай. Монгол Улс нийгмийн хариуцлагын хүрээнд өргөн хэрэглээний программуудад үгийн алдаа шалгах боломжийг үнэ төлбөргүйгээр бүрдүүлж өгөх хэрэгтэй л дээ.

 

АЛДААТАЙ ПРОГРАММУУДЫГ ЗАСАХЫН ТУЛД...

 

-13 жилийн тэртээ, эрдэмтэн Ц.Дамдинсүрэн нарын “Монгол үсгийн дүрмийн толь” болон Я.Цэвэлийн “Монгол хэлний товч тайлбар толь” бүтээлүүдийг сканердаж ном болгоод улмаар дүрс бичиг таних программын (OCR) тусламжтайгаар цахим хэлбэрт шилжүүлж түүнийгээ үг бүрчлэн шалгаж үгийн сангаа бүрдүүлсэн. Мөн толь бичгээс гадна төрөл бүрийн цахим номууд, болон сонинуудыг шүүж шинэ үг олж авдаг байв. Одоогоор 30 орчим мянган үндэс язгуур бүрдүүлээд байгаагаас 33 орчим хувь нь үйл язгуур, хэрэв үйл язгуураа хэв байдлын нөхцлөөр хувилгавал нийт 430 орчим мянган үг үүснэ. Тэдгээрийн 90 орчим хувь нь үйл үг. Нэг үйл үгээс дунджаар мянга орчим нэр, үйл нийлсэн хувилал үүсэх боломжтой гэвэл хамгийн багадаа 250 сая үгийн сан бүрдсэн байгаа. Шинэ үгийг үгийн санд нэмэхдээ аймгаар ангилах учиртай. Үүнийг техникийн тусламжтайгаар, хэрхэн хувилгахыг задлан таньж тохирох хувиллыг оноох программ боловсруулсан. Программын боловсруулсан үр дүнг Adobe InDesign программаас авахуулаад LibreOffice, болон Firefox гэх мэт төрөл бүрийн программууд дээр ашиглаж болно. Дэлгэрэнгүй мэдээллийг https://zuv.bichig.dev сайтаас авах боломжтой.

Журамласан үгийн толийг хийсэн хүмүүсийн зарим нь монгол бичгийн талаа баримталдаг байх магадлалтай. Учир нь өөрсдийн үзлээ дагуулж нэлээн олон үг өөрчилсөн нь анзаарагдсан. Энэ нь нийтэд дүрэм өөрчлөгдсөн мэт сэтгэгдэл төрүүлж байна. Үнэндээ дүрэм огт өөрчлөгдөөгүй. Ердөө зарим үгийн бичлэгийг хуучин монгол бичгийн уламжлал баримтлан өөрчилсөн нь анзаарагдаж байна. Тухайлбал, “Будли” гэсэн үг. Эрдэмтэн Ц.Дамдинсүрэн энэ үгийн уламжлалт бичлэгийг орчин цагийн монгол хэлэнд зохицуулж өөрчилсөн. Гэтэл одоо бол “будил” гэсэн байгаа юм. Хэрэв үг бүрийг буцааж уламжлалаараа бичвэл төвөгтэй байдал учирна гэж харж байна.

Би Ц.Дамдинсүрэн гуайн дүрэм дээр арван жил ажилласан учраас тэр түүний бодол санааг, тухайлбал ямар үгийг яагаад уламжлалт бичлэгээс өөрөөр бичих хэрэгтэй болсныг нэлээн гадарладаг болсон.

 

ЗӨВ БИЧГИЙН АЛДАА ШАЛГАДАГ ПРОГРАММ, ЗӨВ БИЧИХ ДҮРМИЙН ТАЛААР ЯРИХ ЗҮЙЛ ИХ БИЙ

 

-Хүүхдүүдийн дунд үсэглэлийн аварга гээд тэмцээн болсон шүү дээ. Би тэр нэвтрүүлгийг байнга үздэггүй. Ганц нэг дугаарыг нь санаж байна. Миний бодлоор ийм нэвтрүүлгийг хийх нь зөв гэж үздэг, үгнүүд нь дүрмийнхээ хувьд зөв байсан. Гэхдээ зарим үг нь журамласан толийг баримталж, уг толь бичгийг нийтээр мөрдүүлэх хандлага баримталж байгаа нь анзаарагдсан. Ингэх нь зөв. Харамсалтай нь тэр толь маань алдаатай шүү дээ. Ер нь зөв бичгийн алдаа шалгадаг программ, зөв бичих дүрмийн талаар ярих зүйл их бий.

Одоогоор Засгийн газраас хоёр толь гаргасан байгаа. Гэвч энэ хангалтгүй байна шүү дээ. Хуучин байсан үгийн сангаа дахиад цахим болон хэвлэмэл толь болгосон төдий. Сурах бичгүүдэд харь үг нэлээд ашигласан байдаг.  Энэ нь хүүхдүүдэд хичээлийнхээ агуулгыг бүрэн ойлгоход хүндрэл учруулдаг. Тиймээс харь хэлнээс хөрвүүлж болох салбар бүрийн үгсийг тухайн салбарын эрдэмтэд болон монгол хэлний эрдэмтдийн тусламжтайгаар монгол хэлнээ буулгах буюу монгол язгууртай шинэ үг бүтээх байдлаар шийдвэрлэх боломжтой.

 

УЙГУР БИЧИГ, КИРИЛЛ ҮСЭГ ӨӨР ӨӨРИЙН ДҮРМЭЭРЭЭ БАЙХ ЁСТОЙ

 

- Одоогоор би 40-өөд мянган үгийн сан бэлтгэчихсэн. Хэрэв үйл үгүүдээ хувилгавал 430-аад мянган үгтэй.  Ингээд бүх үгээ хувилгавал хамгийн багадаа 250 сая үг болно. Миний зорилго энэ толийг олон нийтэд таниулах. Учир нь би толь бичиг хийгээд 10 жил болсон. Гэхдээ намайг хэн ч мэдэхгүй учраас бусад толиноос хэд дахин давуу болоод үнэгүй толь зохиогоод ч толийг маань төдийлөн сайн ашиглахгүй байна. Гэтэл миний зохиосон туршилтын толийг Харилцаа холбооны зохицуулах хороо гаргаж тавихаар бараг хүн бүр ашиглаж байна. Монголын хамгийн өндөр хандалттай сайтуудын нэг болсон шүү дээ. Үнэндээ энэ хоёр толь бол өдөр шөнө шиг эрс тэс ялгаатай.

Тиймээс одоо миний хийсэн бүтээлийг олон нийтэд нээлттэйгээр үнэгүй ашиглаасай гэж хүсэж байна. Ингэснээр бид бүгд төрөлх хэлээ хамгаалан хадгалж, хөгжүүлэхэд тусалж байгаа хэрэг юм. Би анхнаасаа ашиг олох гэж хийгээгүй.

Мэдээж эрдэмтдийн багийг санхүүжүүлэх хөрөнгийн эх үүсвэр хэрэгтэй. Эрдэмтдийн багт эсрэг тэсрэг мэргэжлийн хүмүүсийг хамтад нь хоршуулан ажиллуулах юм. Байгалийн ухааныхан монгол хэлээр сайтар болохоор мэргэжлийн үгнүүдээ оросоос шууд хуулаад тавьчихдаг юм. Энэ бол арван жилийн хүүхдүүдэд хичээлийн агуулгыг дутуу ойлгоход хүргэдэг. Нэр томьёо, утгыг нь ч мэдэхгүй шууд харь үг ороод ирдэг. Нөгөө үгийг нь толь бичгээс харахаар тайлбар нь байдаггүй. Үүнийг засахын зэрэгцээ дахиад мэргэжил болгоноор үгийн сангаа илүү сайжруулж өргөтгөнө. Ингээд том толь болгож Монгол-Монгол, Монгол-Англи болгох юм. Гаднын монголч эрдэмтдийг ч бас оролцуулахыг хүсэж байна. Монгол үгнүүд  англи хэлэнд хэрхэн бууж байна гэдгийг нь дахиж хянуулах хэрэгтэй.

Одоогоор монгол үгийн алдааг л шалгаж байна.  Цаашдаа утгын алдааг хянадаг болох хэрэгтэй. Компьютерын хэл шинжлэлийн асуудлыг багахан ч атугай шийдвэрлэж, эрдэмтэн Ц. Дамдинсүрэнгийн боловсруулсан кирилл үсгийн дүрмийг бүрэн программчилж, улмаар алдаа шалгах толь гарган авсандаа баяртай байна. Ирээдүйд монгол хэл дээр бичигдэх мянга мянган ном, хэвлэл алдаа шалгагч ашиглаж, алдаагүй зөв бичигдэж эх хэлнийхээ дархлааг улам бүр баталгаажуулж байгаасай хэмээн хүсэж байна.

Эх сурвалж: “Зууны мэдээ” сонин

2021.8.2 ДАВАА № 149 (6626)

Зочин
Үсгийн алдааг хянахгүй утгын алдаа гэж хачин юм болох байлгүйдээ Жнь: Хэдийн бэ г.м
Sain bna uu Batmunh ta holboo barij boloh uu? Hdl zohioliin hureelengiin zahiral bna 99116139
Фото: Эрүүл мэндийн сэдэвт хэлэлцүүлэг боллоо

Фото: Эрүүл мэндийн сэдэвт хэлэлцүүлэг боллоо

13 цаг 30 мин
Гурил, малын тэжээлийн үнийг гаалийн албан татвараас чөлөөлөх тухай хуулийн төслийг дэмжив

Гурил, малын тэжээлийн үнийг гаалийн албан татвараас чөлөөлөх тухай хуулийн төслийг дэмжив

13 цаг 58 мин
Ц.Даваасүрэн:Төрийн өмчит компани байгуулж болохгүй гэсэн хууль баталвал Үндсэн хууль зөрчинө

Ц.Даваасүрэн:Төрийн өмчит компани байгуулж болохгүй гэсэн хууль баталвал Үндсэн хууль зөрчинө

14 цаг 0 мин
М.Оюунчимэг: Эмийн салбарын монополь байдал олон ноцтой асуудал үүсгэж байна

М.Оюунчимэг: Эмийн салбарын монополь байдал олон ноцтой асуудал үүсгэж байна

14 цаг 4 мин
Ерөнхий сайд Л.Оюун-Эрдэнэ НҮБ-ын тусгай элч Жан Тодт-той уулзлаа

Ерөнхий сайд Л.Оюун-Эрдэнэ НҮБ-ын тусгай элч Жан Тодт-той уулзлаа

14 цаг 8 мин
Олон эмэгтэйн краш, улстөрч С.Баярцогт

Олон эмэгтэйн краш, улстөрч С.Баярцогт

14 цаг 24 мин
Г.Дэнзэн: Алдагдсан найман жилийн алдааг засах хөтөлбөр боловсрууллаа

АН-ын Стратеги бодлого, сургалт, судалгааны газрын дарга, 2024 оны УИХ-ын сонгуульд АН-аас дэвшүүлэх мөрийн хөтөлбөр боловсруулах ажлын хэсгийг ахалж ажилласан Г.Дэнзэнтэй Үндэсний аудитын газарт намынхаа мөрийн хөтөлбөрийг хүлээлгэн өгөх үеэр уулзаж ярилцсан юм.

20 цаг 33 мин
Энэтхэгийн сонгууль хамгийн өндөр өртөгтэй

Дэлхийн хамгийн олон хүн амтай Энэтхэг улс ирэх таван жилд улс орноо удирдах удирдагчдыг сонгохоор бэлтгэж байна. Тиймээс ч ирэх дөрөвдүгээр сарын 19-нөөс зургаадугаар сарын 1-нийг хүртэл үргэлжлэх парламентын сонгууль энэ улсын хувьд нүсэр ажил байх нь ойлгомжтой.

20 цаг 38 мин
Эрүүл мэндийн салбарыг цахимжуулах төсөл хэрэгжүүлсэн компанийг АТГ-т шалгуулна

Засгийн газрын өчигдрийн хуралдаанаас гаргасан шийдвэрийн талаар Эрүүл мэндийн сайд С.Чинзориг, Цахим, хөгжил харилцаа холбооны сайд Н.Учрал нар мэдээлэл хийлээ. Сайд нарын байр суурийг хүргэе.

20 цаг 44 мин
МАН-ын эмэгтэй нэр дэвшигчдийг Х.Булгантуяа, АН-ынхыг С.Одонтуяа өнгөлөх үү?

...Тэгэхээр нам, намын лидер эмэгтэйчүүд жагсаалтад “жагсаад” орж ирэхээр болж байгаа юм. Энэ боломж дээр хэн хэн гэдэг эмэгтэй улстөрчид “тоглох” вэ. Энэ бас сонин.

20 цаг 53 мин