தொல்காப்பியத் தரவுமொழியியல் ஆய்வும் தகவல் பெறுகையும்

இந்த மென்பொருளானது தொல்காப்பிய இலக்கணநூலில் நமக்குத் தேவையான விவரங்களை விரைவாகப் பெறுவதற்கு (“Information Retrieval”) உதவும் வகையில் அமைக்கப்பட்டுள்ளது.

தொல்காப்பிய நூற்பாக்கள் இரண்டு வகையில் கொடுக்கப்பட்டுள்ளன. ஒன்று, பதம் பிரிக்காதது. மற்றொன்று பதம் பிரித்தது.

பதம் பிரிக்காத நூற்பாக்கள், உலகத் தமிழாராய்ச்சி நிறுவனம் வெளியிட்டுள்ள கணேசய்யர் பதிப்பை (2007) அடிப்படையாகக் கொண்டுள்ளது. அந்த நிறுவனத்திற்கு எங்களுடைய நன்றி.

தொல்காப்பிய நூற்பாக்களைப் பதம்பிரித்துக் காண மிகவும் பயன்பட்ட நூல் மீனாட்சி புத்தக நிலையம் வெளியிட்டுள்ள மறைந்த பேராசிரியர் தமிழண்ணல் பதிப்பித்துள்ள தொல்காப்பியம் – மூலமும் கருத்துரையும் (2014 நான்காம் பதிப்பு ) என்ற நூலாகும். பேராசிரியர் அவர்களுக்கு எங்களுடைய உளமார்ந்த நன்றியைத் தெரிவித்துக்கொள்கிறோம்.

தொல்காப்பிய நூற்பாக்களுக்கான சூழல்சார் தரவுகள் (Concordancer) , என் -கிராம் ஆய்வு (N-gram analysis), ஒலியனியல் ஆய்வு (Phonological Analysis), புள்ளியில் ஆய்வு ( Statistical Analysis) ,உருபன் ஆய்வு ( Morphological Analysis), சொற்களுக்கான இலக்கணக் குறிப்புகள் ( Wordclass Tagging) ஆகியவற்றை அளிப்பதற்கு மிகவும் பயன்படுத்தப்பட்ட மென்பொருள், என் டி எஸ் லிங்க்சாப்ட் நிறுவனம் வெளியிட்டுள்ள ‘’மென்தமிழ் ஆய்வுத் துணைவன்‘’ என்ற மென்பொருளாகும். அந்த நிறுவனத்திற்கும் எங்களது நன்றி.

உருபன் ஆய்விலும் இலக்கணக் குறிப்புகளிலும் தெளிவான முடிவுகளைப் பெறப் பெரும் அளவில் உதவிய ஆய்வு, அண்ணாமலைப் பல்கலைக்கழகத்தில் மொழியியல் துறைப் பேராசிரியராகப் பணியாற்றி ஓய்வுபெற்றுள்ள பேரா. க. பாலசுப்பிரமணியன் அவர்களின் முனைவர் பட்ட ஆய்வேடான (1981) “ A Descriptive Grammar of Tolkappiyam (Phonology, Morphotactics and Morphology) “ என்பதும் அவருடைய அண்மைக்கால வெளியீடான ‘’ தொல்காப்பியச் சொற்பொருளடைவு – An Index of Tolkappiyam : with grammatical indications and meaning” என்ற தமிழ்ப் பல்கலைக்கழகத்தின் வெளியீடும்(2016) ஆகும், இந்த இரண்டு ஆய்வுகளும்தான் இந்த மென்பொருள் உருவாக்கத்திற்கு மிகப் பெரிய அளவில் உதவியுள்ளது என்றால் அது மிகையாகாது. பேராசிரியர் அவர்களுக்கு எங்களுடைய உளமார்ந்த நன்றியைத் தெரிவித்துக்கொள்கிறோம்.

அடுத்து, பன்னாட்டுத் திராவிட மொழியியல் நிறுவனத்தின் வெளியீடாக வெளிவந்துள்ள (2000) பேராசிரியர்கள் ப.வே.நாகராசன், த. விஷ்ணுகுமாரன் ஆகியோரின் ஆய்வுப்படைப்பான ‘’தொல்காப்பியச் சிறப்பகராதி’’ என்ற நூலாகும். இப்பேராசிரியர்களுக்கும் பன்னாட்டுத் திராவிட மொழியியல் நிறுவனத்திற்கும் எங்களது நன்றியைத் தெரிவித்துக்கொள்கிறோம்.

தொல்காப்பியம் தொடர்பான இந்த மென்பொருளை அதன் உருவாக்கக் கட்டத்தின் பல படிநிலைகளில் எங்களுக்கு ஆக்கபூர்வமான கருத்துரைகளை வழங்கிய அறிஞர்கள் குழுவிற்கு – பேராசிரியர் பொன்னவைக்கோ, பேரா. ந. தெய்வ சுந்தரம், பொறியாளர் திரு. இனியன் நேரு, திரு. மணிமணிவண்ணன், பேராசிரியர் ஜேம்ஸ், பேராசிரியை வி. தனலட்சுமி, நிரலாளர் திரு. பாலாஜு ஆகியோரை உள்ளடக்கிய குழுவிற்கு – எங்களது உளமார்ந்த நன்றி.

மென்பொருள் வடிவமைப்பில் பல உதவிகளை வழங்கிய பேராசிரியர் அ. கோபால், திரு. ஜே. குமார் ஆகியோருக்கும் எங்களது நன்றி.

கணினித்தமிழ் வளர்ச்சிக்காகப் பல்வேறு பணிகளை மேற்கொண்டுவரும் தமிழ் இணையக் கல்விக் கழகத்திற்கும் அதன் தலைவரான திரு. டி.கே. இராமச்சந்திரன் இ.ஆ.ப. அவர்களுக்கும் அதன் மேனாள் இயக்குநராகவும் இன்றைய இயக்குநர் குழு உறுப்பினராகவும் பணியாற்றிவருகிற திரு. த. உதயச்சந்திரன் , இ.ஆ.ப. அவர்களுக்கும் எங்களுடைய உளமார்ந்த நன்றியைத் தெரிவித்துக்கொள்கிறோம்.

இந்த மென்பொருளானது தொல்காப்பிய இலக்கண நூலைக் கீழ்கண்ட நிலைகளில் ஆராய்ந்து, ஆய்வாளர்களுக்குத் தேவையான தகவலைத் தருகிறது. • தகவல் பெறுகை • புள்ளியியல் ஆய்வு • ஒலியனியல் ஆய்வு • உருபனியல் ஆய்வு • விகுதிகள் – வருகைமுறை • சொல்லடைவு • கலைச்சொற்களஞ்சியம்

தகவல் பெறுகை

இது ஒரு தொல்காப்பியத் தேடுபொறியாகும். தொல்காப்பியத்தின் பதம் பிரிக்காத பனுவல், பதம் பிரித்த பனுவலை அடிப்படையாகக்கொண்டு கீழ்க்காணும் இருநிலைகளில் இது செயல்படுகிறது. 1. தொல்காப்பியத்தில் இடம்பெற்றுள்ள எந்த ஒரு சொல்லையும் தட்டச்சுசெய்து, அச்சொல் பயின்றுவரும் நூற்பாவினை, அதன் அதிகாரம், இயல், வரிசையெண் ஆகியவற்றுடன் பெறலாம்.

2. தொல்காப்பியத்தின் அதிகாரம், இயல், நூற்பா எண், வரிசை எண் அடிப்படையில் நூற்பாக்களைப் பெறலாம்.

புள்ளியியல் ஆய்வு

தொல்காப்பியப் பனுவலை புள்ளியியல் அடிப்படையில் ஆராய்கிறது.
1. வருகைப்புள்ளி:   தொல்காப்பியத்திலுள்ள ஒவ்வொரு சொல்லுக்கும், அச்சொல் தொல்காப்பியத்தில் எத்தனைமுறை பயின்றுவந்துள்ளது என்ற எண்ணிக்கையையும், அச்சொல்லின் நிகழ்வெண்ணையும் தருகிறது.

2. சொற்சூழலடைவி: இது தொல்காப்பியத்திலுள்ள ஒவ்வொரு சொல்லுக்கும், சொற்சூழலடைவு செய்கிறது. வலது மற்றும் இடது மாறிகளைத் தேவைக்கேற்ப மாற்றிக்கொள்ளலாம்.

3. N-gram -ஆய்வு  :    இங்கு, தொல்காப்பியத்திலுள்ள ஒவ்வொரு சொல்லுக்கும்,   N-gram  ஆய்வு மேற்கொள்ளப்படுகிது. முன், பின் உள்ள மூன்று சொற்களுக்கு இவ்வாய்வு நிகழ்த்தப்படும்.

ஒலியனியல் ஆய்வு

தொல்காப்பியத்தை ஒலியனியல் அடிப்படையில் ஆராய்கிறது.
1. ஒலியன் வருகை: தொல்காப்பியத்தில் எந்தெந்த எழுத்துகள் சொல்லின்முதலிலும், இறுதியிலும் வந்துள்ளன என்ற பட்டியலைத் தருகின்றது. சொல்லிடையில் இடம்பெற்றுள்ள இரண்டு மற்றும் மூன்று மெய்ம்மயக்கங்களைப் பட்டியலிடுகின்றது. ஒவ்வொன்றைச் சொடுக்கும்போதும், அவை இடம்பெற்றுள்ள சொற்களும் காட்டப்படுகின்றன. 

2. ஒலியசை அமைப்பு: தொல்காப்பியத்தின் ஒவ்வொரு சொல்லையும், மொழியசையை அடிப்படையாகக்கொண்டு தொடக்கம், உச்சி, ஒடுக்கம் என்று பிரித்துக்காட்டுகிறது.

உருபனியல் ஆய்வு

தொல்காப்பியத்திலுள்ள ஒவ்வொரு சொல்லையும் உருபனியல் அடிப்படையில் பிரித்து, அதற்கான இலக்கணக்குறிப்பு தரப்படுகிறது.
1. உருபன் பகுப்பி: இங்கு ஒவ்வொரு சொல்லுக்கும் பகுபத ஆய்வு நிகழ்த்தப்படுகிறது. ஒவ்வொரு சொல்லையும், வேர்ச்சொல் மற்றும் விகுதிகளாகப் பிரித்து அதன் இலக்கண வகைப்பாடு மற்றும் முழுச்சொல்லின் இலக்கணக்குறிப்பு கொடுக்கப்பட்டுள்ளன. தொல்காப்பியத்தில் இடம்பெற்றுள்ள வேர்ச்சொற்களைப் பட்டியலிட்டு, அவற்றைச் சொடுக்கும்போது, அதன் பல்வேறு வடிவங்களையும் காட்டுகிறது.

2. இலக்கண வகைப்பாடு: தொல்காப்பியத்தில் இடம்பெற்றுள்ள இலக்கண வகைப்பாட்டினைப் பட்டியலிடுகிறது. ஒவ்வொரு வகைப்பாட்டினைச் சொடுக்கும்போதும் அந்த வகைப்பாட்டில் இடம்பெற்றுள்ள சொற்கள் வரிசைபடுத்தப்பட்டு, அவற்றின் பகுபத ஆய்வும் தரப்படுகின்றன.

விகுதிகள் – வருகைமுறை

தொல்காப்பியத்தில் இடம்பெற்றுள்ள விகுதிகள் மற்றும் அவற்றின் வருகைமுறையை ஆராய்கிறது.
1. விகுதிகள்: தொல்காப்பியத்தில் இடம்பெற்றுள்ள விகுதிகளின் இலக்கண வகைப்பாட்டினைப் பட்டியலிட்டு, ஒவ்வொரு வகைப்பாட்டிலுமுள்ள விகுதிகளை வரிசைபடுத்தி, அவ்விகுதிகள் இடம்பெற்றுள்ள சொற்களைப் பட்டியலிட்டுக்காட்டுகிறது. 

2. வருகைமுறை: தொல்காப்பியத்தில் ஒரு குறிப்பிட்ட இலக்கண வகைப்பாட்டிற்கடுத்து எந்தெந்த இலக்கண வகைப்பாடுகள் வந்திருக்கின்றன என்பதைக் காட்டுகிறது.

சொல்லடைவு

தொல்காப்பிய நூற்பாக்களின் முதல் மற்றும் இறுதிச் சொற்களின் அடிப்படையில் சொல்லடைவு தரப்பட்டுள்ளன. பதம் பிரித்த மற்றும் பிரிக்காத பனுவல் இரண்டிற்கும் சொல்லடைவு கொடுக்கப்பட்டுள்ளன. 

கலைச்சொற்களஞ்சியம்

தொல்காப்பியத்தில் இடம்பெற்றுள்ள கலைச்சொற்கள் இனங்காணப்பட்டு அகரவரிசைபடுத்தப்பட்டுள்ளன. ஒவ்வொரு கலைச்சொல்லிற்கும், அச்சொல் இடம்பெற்றுள்ள இயல், அதற்கான எளிமையான விளக்கம் தரப்பட்டுள்ளன. அக்கலைச்சொல்லை விளக்கும் தொல்காப்பிய நூற்பா இருப்பின், அந்த நூற்பாவும் கொடுக்கப்பட்டுள்ளது.

Source: http://www.tamilvu.org/ta/content/%E0%AE%A4%E0%AE%AE%E0%AE%BF%E0%AE%B4%E0%AF%8D%E0%AE%95%E0%AF%8D-%E0%AE%95%E0%AE%A3%E0%AE%BF%E0%AE%A9%E0%AE%BF%E0%AE%95%E0%AF%8D-%E0%AE%95%E0%AE%B0%E0%AF%81%E0%AE%B5%E0%AE%BF%E0%AE%95%E0%AE%B3%E0%AF%8D

Thanks to Tamil Virtual Academy, Chennai for releasing ths source code of this application.

License : GPL V2

Check https://commons.wikimedia.org/wiki/File:Tamil-Virtual-Academy-Copyright-Declaration.jpg for license info.