User Tools

Site Tools


pro-tamocr

தமிழ் - ஒளி உரு படிப்பி (Tamil -Optical Character Reader)

முன்னுரை

கணினியின் பரவலான செயல்பாட்டிர்க்கு பிரகு பெரும் அளவிலான தமிழ் நூல்களும் கோப்புகளும் இலக்கமுறைஆக்கப்பட்டு இருக்கின்றன. ஆனால் இவற்றுள் பெரும்பான்மையான தரவுக்ள் புகைபட வடிவிலேயே உள்ளன. இதனால் அப்பதிவுகளை மாற்றத்திரற்க்கு உட்படுத்த கடினமாக உள்ளது. இப்பதிவுகளை மாற்றதக்க எழுத்து வடிவிற்க்கு கொண்டு வருவதே இந்த திட்டம். இந்த தரவுகள் கையால் எழுதப்பட்டவையோ அல்லது தட்டச்சு செய்யப்பட்டவையாக கூட இருக்கலம். இது போண்று ஏல்லா வகையான தரவிலிருந்தும்,செயற்கை அறிவாற்றலைக் கொண்டு எழுத்துக்களை பிரிதெடுப்பதே இந்த முயற்சி.

மாதிரி தரவுகள்:

1) http://www.jfn.ac.lk/index.php/data-sets-printed-tamil-characters-printed-documents/ 2)http://www.ifpindia.org/digitaldb/online/manuscripts/index.php

இன்னும் நிறைய மாதிரி தரவுகள் தேவை படுகின்றன, எனவே அதை புகைபடவடிவில் திரட்ட திட்டமிடபட்டுள்ளது , யாரேனும் உதவ விருபப்பட்டால் இந்த திட்டம் சார்ந்த மின்அஞ்சலை அனுகலாம்

pro-tamocr.txt · Last modified: 2019/01/04 23:36 by Arunekumar