(முந்தைய பதிவு) எழுத்துப் பிழைகள் எல்லாம் ஒட்டிப்பிறந்தவையாக எனது எழுத்தோடு வந்துகொண்டிருந்த காலத்தில் ஒரு மறுமொழி எனது மொழியறிவை மேம்படுத்திக் கொள்ளத் தூண்டியது. அப்போது கற்றிருந்த ஜாவாஸ்கிரிப்ட் நிரல்மொழி உதவியுடன் ஒற்றுப் பிழைக்கு மட்டும் சிறு செயலி உருவாக்க முனைந்து முடியாமல் போனது. ஆண்டொன்று கடந்தபோதே நிரலாக்க மற்றும் மொழிநுட்ப அறியாமை விலகி நாவி என்று எனக்காக சந்திப்பிழைகளுக்கு ஒரு செயலி தயாரிக்க முடிந்தது.
அச்செயலி திருத்துதலை விட கற்பிப்பதையே முக்கியமாகக் கொண்டிருந்தது. சந்தி இலக்கணத்தின் தேவை அத்தகையது. அந்த நாவி பிழைதிருத்தியைப் பொதுப்பயன்பாட்டிற்கு வெளியிட்டபோது போது பலர் அதைப் பயனுள்ளதாகவே கருதினர். ஆனால் முழுமையான எழுத்துப்பிழை திருத்தியுடன் ஒப்பிடுகையில் நாவின் பங்கு சொர்ப்பம் என்று அத்திருத்திக்காகப் பல்வேறு நூல்களும், அறிஞர்களின் விளக்கங்களும் படிக்க நேர்கையில் உணரமுடிந்தது.
எளிதில் கிடைக்கக்கூடிய கூகிள் ஸ்கிரிப்ட் மொழியைக் கற்றுவந்தபோது நண்பர் தகவலுழவனின் ஒரு வேண்டுகோளுக்கிணங்க ஒரு தானியங்கி செய்து இணைய அகராதி ஒன்றில் 1.1 லட்சம் தமிழ்ச் சொற்களை விக்சனரிக்காக எடுத்தேன். அப்போதைக்கு அப்பணி முடிந்தது. ஆனால் இப்பட்டியலே பிற்கால எழுத்துப்பிழை ஆய்விற்கு அடிக்கோளாக இருந்தது. தமிழ் ஒரு ஒட்டுநிலை மொழியாததால் அகராதிச் சொற்கள் மட்டும் கொண்டு ஒரு திருத்தி செய்வது முடியாத காரியம் என்பதால் ஆர்வமிருந்தாலும் வழியின்றி திருத்திக்கான திட்டம் கிடப்பில் போடப்பட்டது
தமிழ் பிழை திருத்திக்கான அடிப்படை நுணுக்கம் என்ன என்ற தொடராய்வு ஒருநாள் வெற்றிபெற்றது அதாவது வேர்ச்சொல்லையும் அதன் குடும்பப் பண்பையும் கணினிக்குக் கற்றுத்தருவதன் மூலம் அந்த வேர்ச்சொல்லின் அனைத்துவடிவங்களையும் கணினி புரிந்து கொள்ளத் தொடங்கியது. அடுத்த சவால் தொழிற்நுட்பம். இவ்வளவு பெரிய பட்டியலை எவ்விதத்தில் கணினிக்குத் தருதல் உகந்தது என்று தேடியும் கற்கவும் முனையும் போது கூகிள் ஸ்கிரிப்ட் மொழியே ஆய்வு நிலைக்குப் பொருந்தியது. காரணம் இம்மொழியை இயக்க பொருட்செலவில்லை, மேகநுட்பம் என்பதால் எங்கிருந்தும் ஆய்வைத் தொடரலாம், பிற கூகிள் விரிதாள் போன்ற தரவுதளச் செயலிகளை எளிதில் அனுகலாம்.
முன்னர் திரட்டிய சொற்பட்டியலை இப்போது குடும்பம் குடும்பமாகப் பிரிக்கப்பட்டது, இப்பணிதான் மிகவும் தொய்வைக் கொடுக்கக்கூடியது. ஒவ்வொரு சொல்லையும் பல்வேறு நிலைகளில் சோதித்த பின்னர்தான் அதற்கான குடும்பத்தில் சேர்க்கமுடியும். கொஞ்சம் தானியக்கம், கொஞ்சம் கைமுறைத் திருத்தம் எனக் கடந்து முழுப் பட்டியல் தயாரானது. புதிய திருத்திக்கான நிரலாக்கக் கட்டமைப்பை முடித்து இயக்கும் போது புதிய சவாலாக அதீத காலத்தாமதம் ஏற்பட்டது.
காரணம் இலட்சக்கணக்கான சொற்களைப் பிடித்துச் சோதித்து பிழைகாட்டுவதற்குள் நாமே படித்துத் திருத்திவிடலாம் என்பது போன்ற தாமதம். சில புதுப்புது யுக்திகள் மூலம் திருத்தியின் நேரத்தைச் சேமிக்க முயன்றாலும் பலனில்லை. காரணம் கூகிள் ஸ்கிரிப்ட் ஆய்விற்கு ஏற்றது ஆனால் வெளியீட்டிற்கு உகந்ததில்லை என்று புரிந்தது. அதன் பிறகு ஒருவிதத்தில் இத்திட்டம் கிடப்பில் மீண்டும் போடப்பட்டது. பைத்தான் என்ற மொழியை இயக்கும் அளவிற்குக் கற்கமுடியவில்லை. என்னிடமிருந்த பழைய விபி தொகுப்பியில் தமிழ் ஒருங்குறி இணக்கமில்லை.
இறுதியாக சி#, டாட் நெட் மொழி கற்க வாய்ப்பு கிடைத்தது. அவ்வாய்ப்பில் எழுத்துப்பிழை திருத்தியை மீண்டும் புதிதாக உருவாக்க முயலப்பட்டது புதுமொழிக்கே உரிய தடங்கல்களைத் தாண்டி மேசைக்கணினிக்கான செயலிமட்டும் உருவாக்கப்பட்டது. ஆனால் இதைக் கொண்டு இணையத்தில் நேரடியாகப் பயன்படுத்த முடியாததால் எல்லாருக்குமானதாக இதுயில்லை. டாட் நெட் நுட்பத்தில் இணையதளத்தை உருவாக்குவது மட்டுமே கண்ணுக்குத் தெரிந்த தீர்வாகப்பட்டது. அதற்கான புரவல் வழங்கியின் பொருட்செலவு கொஞ்சம் தயக்கத்தைத் தந்தபோது வலைத்தமிழ் பார்த்தசாரதி அண்ணன் உடனே தனது வழங்கியைத் தந்தார். பின்னர் சில மாதத்தில் புதிய தளம் கட்டப்பட்டு வாணி பிறந்துவிட்டாள்
--
எழுத்துப் பிழை திருத்தி சவால்கள்
பொதுவாகப் பிழை திருத்திகளில் கொடுக்கப்படும் சொற்களில் கணிக்கவியலாச் சொற்களை விட்டுவிட்டுப் பிழையென கண்டுபிடித்த சொற்களை மட்டுமே சுட்டுக்காட்டும் யுக்தி கையாளப்படும். அரிசியில் கல்லைப் பொறுக்குவது போல மேலோட்டமான இம்முறையில் ஒருவகையில் நம்பகத்தன்மை குறைகிறது.
சல்லடையால் ரவையைச் சலிப்பதுபோல ஆழமாகச் சொற்களைச் சேதித்து, பிழைகளைக் காட்டும் முறையே சிறந்தது. ஆனால் தமிழ் போன்ற ஒட்டுநிலை மொழிகளில் அதாவது ஒன்றிக்கும் மேற்பட்ட சொற்கள் இணைந்து வழங்கப்படும் போது இது சாத்தியாமா என்று கேள்வி எழும். ஒரு பெயர்ச்சொல்லானது
வினைச்சொல்லுடனும் இணைந்து எண்ணிக்கையில்லாத அளவிற்கு வரிந்தாலும் பிரதானமான பயன்பாட்டின்படி ஒரு பெயர்ச்சொல்லானது சுமார் 640 விதங்களிலும் அதேபோல வினைச்சொல்லும் பிரதானமான பயன்பாட்டின்படி 1450 விதங்களிலும் பயன்படுத்தப்படுகிறது. இவற்றைக் கருத்தில் கொண்டு தற்காலப் பிழைதிருத்தி யுக்தியுடன் தமிழில் அமைக்க குறைந்தது சுமார் 35 மில்லியன் சொற்கள் வேண்டும்.
பிறமொழி திருத்திகளை மட்டும் பின்பற்றி இம்மாதிரி இயல்மொழி பகுப்பாய்வு என்பது மிகவும் கடினமாகிவிடும். ஆனால் நமது தொல்காப்பியரும் நன்னூலாரும் தமிழுக்கான புணர்ச்சி விதிகளை ஈராயிரம் ஆண்டுக்கு முன்னரே தந்துவிட்டனர்.
எனவே மற்ற மொழி திருத்திகளைப் பின்பற்றாமல் தமிழுக்கென்று புதிய அணுகுமுறைவேண்டும். அதில் தற்காலநடைமுறையில் உள்ளவிதிகளைக் கணினிக்குக் கற்பிப்பதன்மூலன் 35 ஆயிரம் வேர்ச்சொற்கள் மட்டும் கொண்டு சாராசரியான பிழைதிருத்தியை வடிவமைக்கமுடியும்.
இரண்டே ஆண்டுகளில் உருவாகியிருக்கும் இதில் "தமிழர்களாகயிருக்கிறார்கள்" என்று தட்டச்சிட்டாலும் படித்துப் புரிந்துகொண்டு "தமிழர்களாகவிருக்கிறார்கள்" என்று பிழைதிருத்தி வழங்கும்.
இயல்பாக ஒரு எழுத்துப்பிழை திருத்தி உருவாக்குவதில் உள்ள சவால்கள் நீங்கலாக, தமிழில் பிழை திருத்திகள் உருவாக்குவதில் எதிர்படும் சவால்கள் சில
பிறமொழி திருத்திகளைப் பின்பற்றி தமிழுக்கு உருவாக்க முடியாததால் தமிழ்ப் பின்புலத்தில் இருந்து சிந்திக்கவேண்டும். தமிழும், கணினியும் ஆழமாகக் கற்கவேண்டும்.
தற்காலத் தமிழ்ச் சொற்பட்டியல்கள் எளிதில் கிடைப்பதில்லை, கிடைத்தாலும் "தேர்வுக்குழு", "காவல்நிலையம்", "முதலமைச்சர்" போன்ற இருசொலால் இணைந்த ஏராளமான சொற்கள் அகராதியிலும் இருப்பதில்லை அத்தகைய சொற்களைத் தானியங்கி கருவி கொண்டோ, கைமுறையிலோ இணையத்திலிருந்து திரட்டவேண்டும்.
ஒரு மூலச் சொல் எந்தெந்த வகையில் தற்காலத்தில் பிற இடைச்சொல்லுடன் புணரும் என்ற தகவல்கள் எளிதில் தெரிவதில்லை எனவே அதற்கான பட்டியலை முதலில் தயாரிக்க ஒரு தமிழ் வாசகராக மாறவேண்டும்.
தயாரித்த பட்டியல் மூலம் ஒரேமாதிரி விதிகள் கொண்ட சொற்களை அதற்கான பகுப்பில் இடவேண்டும். இதுதான் கடினமான பணி. கொஞ்சம் சொற்களைப் பகுப்பில் போட்டப்பிறகு புதிதாக ஒரு விதி அவற்றுக்குள் மாறுபடும் பிறகு மீண்டும் முதலிருந்து பகுக்கவேண்டும்
எழுத்துப்பிழை திருத்தி என்பது நீண்டகாலத் திட்டம் என்பதாலும் வணிகச் சந்தை இல்லையென்பதாலும் கல்லூரி மாணவர்கள் முதல் தனியார்வரை உழைப்பையோ, பொருளையோ செலவளிக்க முடிவதில்லை.
பிழை போல இருக்கும் சில சொற்கள் வேறு பொருளில் சரியான சொல்லாக இருக்கிறது. உதாரணத்திற்கு "அவண்" என்ற சொல் ஆண்பால் சுட்டுப்பெயரின் பிழையான வடிவம் என நினைத்தால் தவறு. இச்சொல்லுக்கு அவ்விடம் என்ற பொருள் உள்ளதால் சரியான சொல்லே. இதுபோல பல சொற்கள் விடுபடலாம் அதனை சோதனை செய்து கண்டுபிடிக்கவேண்டும்.
கணித்தமிழ் இன்றைய நிலை
கடந்தாண்டு புதுவையில் நடந்த உத்தமம் மாநாட்டில் ஆய்வுக்கட்டுரைகளைச் சமர்ப்பிக்க பதிவுக் கட்டணம் 3000 ரூபாய். இதில் மாணவர்கள், பேராசிரியர்கள், மென்பொருள் வல்லுநர்கள் போன்ற தொழில்ரீதியாக மேம்பாட்டைப் பெறக்கூடியவர்கள் மட்டுமே கலந்துகொள்ளமுடியும். தன்னார்வலர்களால் முடியாது. அதேவேளையில் தமிழ் செம்மொழி அங்கீகாரம் பெற்ற பிறகு கணினித் தமிழ் வளர்ச்சிக்கு நல்ல நிதி பல்வேறு அமைப்புகளுக்கு ஒதுக்கப்படுகிறது.
ஆய்வுகளுக்கு நிதி ஒதுக்கப்படுகிறதா? சரியாகப் பயன்படுகிறதா? எனத் தெரியவில்லை. இவர்களின் செலவுகளை நடைமுறைப் பயன்பாட்டிற்கு உகந்த வகையில் மாறவேண்டும். அந்த நிதியைக் கொண்டு இத்தகைய ஆய்வு மாநாட்டுக் கட்டணத்தை ஏற்று தன்னார்வலருக்கு உதவியிருக்கலாம்.
பல்வேறு தமிழ் மென்பொருட்கள் எழுத்துணரி முதல் சிறுசிறு அகராதிகள், ஆண்ட்ராய்ட் எழுதிவரை சிலர் உருவாக்கினாலும் அதிகப் பொருட்செலவுடன் உருவாக்கியுள்ளதால் அவற்றை இலவசமாக அவர்கள் வெளியிடுவதில்லை. அரசு அவற்றை வாங்கி திறமூலமாக நாட்டுடைமையாக்கலாம் அதன் மூலம் தொழிற்நுட்ப வளர்ச்சிக்கு உதவும். ஒரு நிலையான வருமானம் இருப்பதால்தான் என்னால் தொடர்ந்து இதனைச் செய்துவரமுடிகிறது. வருமானம் குறைவாக இருந்து படைப்பாற்றல் இருக்கும் ஒருவர் தொழிற்நுட்பத்தில் பங்களிப்பது இயலாதகாரியமாகிவிடுகிறது.
தமிழை வைத்து வியாபாரம் பார்ப்பதா? என்று கூறிக்கொள்பவர்கள் தன்னார்வலர்களின் முயற்சிகளுக்கு புரவலர்களாக இருப்பதில்லை. இப்படி இருக்கும் போது எப்படி இலவச மென்பொருட்கள் வளரும்? புத்தகங்களுக்குச் சந்தை உள்ளதோ அதேபோல தமிழ் மென்பொருட்களுக்கும் சந்தை உருவாகும் போது ஆற்றல் மிக்க மென்பொருட்கள் வந்து குவியும் என்று நம்புகிறேன்.
தமிழில் இது போன்ற ஆக்க பூர்வமான பணிகள் செய்யும் நீச்சல்காரன் போன்றவர்களுக்கு நீங்கள் ஆதரவு கரம் நீட்ட வேண்டும். இதனை பலருக்கும் கொண்டு சேர்க்க உங்கள் நட்பு வட்ட வட்டத்தில் பகிர அழைக்கின்றேன்.
பின்குறிப்பு
பலரும் என்னிடம் குறுகிய காலத்தில் அதிக மின் நூல்களை வெளியிட்டு உள்ளேன் என்று ஆச்சரியப்பட்டனர்.
அதற்குக் காரணம் நீச்சல் காரன் வெளியிட்டுள்ள சந்திப்பிழை திருத்தி மற்றும் வாணி தமிழ் பிழைத்திருத்தியுமே காரணம் ஆகும்.
கடந்த 2001 வருடம் தொடங்கி அதற்குப் பிறகு தமிழகத்தில் பள்ளியில் சேர்ந்த மாணவர்கள் 70 சதவிகிதம் ஆங்கில வழிக்கல்வியில் கற்றுக் கொண்டு வருவதால், அவர்கள் ஒவ்வொருவரும் எதிர்காலத்தில் இணையத்தில் புழங்கும் போது அவர்கள் மறந்த தமிழ் வார்த்தைகளை நிச்சயம் இது போன்ற மென்பொருட்கள் அவர்களுக்கு அடையாளம் காட்டும் என்பதால் இவரைப் போன்றவர்கள் ஆதரிப்பது நமது கடமையாகும்.
தமிழ் என்ற மொழி ஒவ்வொரு காலகட்டத்திலும் பல பிழைப்பு வாதிகளைத் தாண்டி இவரைப் போன்ற குறுகிய நபர்கள் மூலம் தான் அடுத்தடுத்த கட்டத்திற்கு நகர்ந்து வந்துள்ளது என்பதை நாம் கவனத்தில் கொள்வோம்.