භාෂා තාක්ෂණ පර්යේෂණාගාරය
කොළඹ විශ්වවිද්යාලයීය පරිගණක අධ්යයනායතනය
|
|
|
|
පරිගණකමය වාග් විද්යාව හා භාෂා පැසුරුම්කරණය සම්බන්ධයෙන් භාෂා තාක්ෂණ පර්යේෂණාගාරය විවිධ පර්යේෂණ කටයුතුවල නියැලෙයි. මෙයින් සමහරෙක් බාහිර ආයතන සමඟ සම්බන්ධ වී කෙරෙන අතර තවත් සමහරෙක් පර්යේෂණාගාරයේ සාමාජිකයින්ගේ පුද්ගලික උනන්දුව අනුව සිදුවෙයි.
එයින් සමහරෙක් නම්:
|
.....................................................................................................................................
|
අත් අකුරු සක්රීයව හඳුනාගැනීම (Online Handwriting Character Recognition)
සිංහල අත් අකුරු සක්රීයව හඳුනාගැනීමේ ක්රමවේදයක් හඳුන්වාදීම මෙම පර්යේෂණයේ අරමුණයි. මෙහිදී මූලික වශයෙන් අකුරු වෙන් වෙන්ව හඳුනාගැමේ ක්රමවේදයක් ඉදිරිපත් කරනු ලැබ පසුව එය වචන හඳුනා ගත හැකි ආකාරයට වැඩිදියුණු කරනු ලැබේ.
ඉන්දීය භාෂා සඳහා ආකෘතිගත (template-based) ප්රත්යස්ථතා ගැලපුම් (elastic matching - EM) ඇල්ගොරිදම සනාථ කර ඇති ප්රතිඵල නිසාම, මෙම පර්යේෂණයෙදී ඒවා සිංහල අත් අකුරු සඳහා කෙතෙක් දුරට ගැලපේ දැයි සොයා බැලෙයි. මුද්රිත අකුරු හඳුනාගැනීමේ මෘදුකාංගය නිර්මාණයේදී අප ලද අත්දැකීම් අනුව මෙම පර්යේෂණයේ මුල් පියවරවලදී k-වැනි අනුයාත (k-nearest neighbor) ඇල්ගොරිදමය හා ඉයුක්ලිඩියානු දුර (Euclidian distance) පරීක්ෂා කරනු ලැබේ. පසුව මේ සඳහා බහුලව භාවිත වන ගතික ක්රමලේඛණය (dynamic prgramming - DP) හා ගතික කාල හැකුළුම (dynamic time warping - DTW) අත්හදා බැලෙනු ඇත.
තවද, සිංහල අත් අකුරු සංහිතාවක්ද මෙම පර්යේෂණයේ අතුරු ඵලයක් ලෙස නිර්මාණය කරනු ලැබේ.
පර්යේෂණ කාල සීමාව: අවු. 3
පර්යේෂකයින්: අසංක වාසල
අධීක්ෂක: ආචාර්ය රුවන් වීරසිංහ
|
| © Language Technology Research Laboratory, 2011 |
Last updated on 14 December 2011 |