භාෂා තාක්ෂණ පර්යේෂණාගාරය
භාෂා තාක්ෂණ පර්යේෂණාගාරය
කොළඹ විශ්වවිද්‍යාලයීය පරිගණක අධ්‍යයනායතනය

පරිශීලන උදවු   භාෂාව ‍තෝරන්න:   English   සිංහල
පරිගණකමය වාග් විද්‍යාව හා භාෂා පැසුරුම්කරණය සම්බන්ධයෙන් භාෂා තාක්ෂණ පර්යේෂණාගාරය විවිධ පර්යේෂණ කටයුතුවල නියැලෙයි. මෙයින් සමහරෙක් බාහිර ආයතන සමඟ සම්බන්ධ වී කෙරෙන අතර තවත් සමහරෙක් පර්යේෂණාගාරයේ සාමාජිකයින්ගේ පුද්ගලික උනන්දුව අනුව සිදුවෙයි. එයින් සමහරෙක් නම්:
.....................................................................................................................................

අත් අකුරු සක්‍රීයව හඳුනාගැනීම (Online Handwriting Character Recognition)

සිංහල අත් අකුරු සක්‍රීයව හඳුනාගැනීමේ ක්‍රමවේදයක් හඳුන්වාදීම මෙම පර්යේෂණයේ අරමුණයි. මෙහිදී මූලික වශයෙන් අකුරු වෙන් වෙන්ව හඳුනාගැමේ ක්‍රමවේදයක් ඉදිරිපත් කරනු ලැබ පසුව එය වචන හඳුනා ගත හැකි ආකාරයට වැඩිදියුණු කරනු ලැබේ.

ඉන්දීය භාෂා සඳහා ආකෘතිගත (template-based) ප්‍රත්‍යස්ථතා ගැලපුම් (elastic matching - EM) ඇල්ගොරිදම සනාථ කර ඇති ප්‍රතිඵල නිසාම, මෙම පර්යේෂණයෙදී ඒවා සිංහල අත් අකුරු සඳහා කෙතෙක් දුරට ගැලපේ දැයි සොයා බැලෙයි. මුද්‍රිත අකුරු හඳුනාගැනීමේ මෘදුකාංගය නිර්මාණයේදී අප ලද අත්දැකීම් අනුව මෙම පර්යේෂණයේ මුල් පියවරවලදී k-වැනි අනුයාත (k-nearest neighbor) ඇල්ගොරිදමය හා ඉයුක්ලිඩියානු දුර (Euclidian distance) පරීක්ෂා කරනු ලැබේ. පසුව මේ සඳහා බහුලව භාවිත වන ගතික ක්‍රමලේඛණය (dynamic prgramming - DP) හා ගතික කාල හැකුළුම (dynamic time warping - DTW) අත්හදා බැලෙනු ඇත.

තවද, සිංහල අත් අකුරු සංහිතාවක්ද මෙම පර්යේෂණයේ අතුරු ඵලයක් ලෙස නිර්මාණය කරනු ලැබේ.

පර්යේෂණ කාල සීමාව: අවු. 3
පර්යේෂකයින්: අසංක වාසල
අධීක්‍ෂක: ආචාර්ය රුවන් වීරසිංහ

............................................................. .............................................................

© Language Technology Research Laboratory, 2011 Last updated on 14 December 2011