Wiki
மென்பொருள் மொழியாக்கம் - சில குறிப்புகள்
1. மொழியாக்கம் - பின்னணியும் தேவைகளும்
1.1 மென்பொருளின் பிறப்பு
கணினிப் பயன்பாட்டின் தொடக்கத்தில் ஆங்கிலத்தில் மட்டுமே செய்யப்பட்ட, ஆங்கிலத்தை மட்டுமே கையாளக்கூடிய மென்பொருள்களே இருந்தன. ஆனால் கணினியின் பரவலான பயன்பாடு வளர வளர, பல மொழி பேசும் மக்களுக்கும் கணினிப் பயன்பாடு விரிந்தது. அவரவர் தங்கள் மொழியைக் கையாளக்கூடிய மென்பொருள்களை வேண்ட ஆரம்பித்தனர். கையாளுவதோடு அல்லாமல், இன்னும் ஒருபடி மேலே போய், அவரவர் மொழியிலேயே கணினியுடன் செயல்புரியும் சாத்தியங்களும் ஆராயப்பட்டன. (இப்படி மென்பொருள்களின் பன்மொழித்திறனை இரு நிலைகளாகக் குறிப்பிடவேண்டிய தேவை இக்கட்டுரையின் முடிவில் இன்னும் தெளிவாகும்.) இவ்வாறு அவரவர் மொழியில் மென்பொருள்களை செய்துகொள்ளும் முயற்சிகள் திறமூல(opensource) அமைப்புகளின் ஆர்வலர்களால் இன்று மேலும் ஊக்கம் பெற்று வருகின்றன.
1.2. முதல் கட்டத் தமிழ் மென்பொருட்கள்
ஆரம்பக் கட்டத்தில் தமிழில் கிடைத்த மென்பொருட்கள் தனிமனித/தனியார் நிறுவனங்களின் முயற்சியால் வெளிவந்தவையே. அவற்றின் முக்கியக் குறிக்கோள்கள் தமிழில் உரை (text) தயாரித்தலும், மின்னஞ்சல் அனுப்புதலும்/பெறுதலும். இந்த மிக அடிப்படையான பயன்கள், கணினியை ஒரு தட்டச்சுக் கருவியாகவும், தொலைபேசி/தொலைநகலுக்குக்கு மாற்றான தகவல் தொடர்புக் கருவியாகவும் பயன்படுத்தவுமே போதுமானவை. இன்றும், பலர் கணினியை இப்படியான செயல்களுக்கு மட்டுமே பயன்படுத்தினாலும், பன்முகத்தன்மை கொண்ட திறன்வாய்ந்த சாதனமான கணினியை இப்படி சுருக்கிவிட முடியாது.
1.3. மென்பொருட்களின் அசுரவளர்ச்சி
அடுத்த வளர்ச்சியாக இணைய வலை விரிந்தது. அலுவலகத்தில், வீடுகளில் மேசைக்கணினி பரவியது. விரிதாள் (spreadsheet), ஆவணத் தொகுப்பான் (document editor),திரைக்காட்சி செயலி (Presentation Manager) என்று கணினியின் பன்முகத்தன்மையும், பல்லூடகத்தன்மையும் பலருக்கும் புரிந்தது. அப்போது பல மொழிகளில் அமைந்த உள்ளடக்கத்தை, உலகளாவிய அளவில் பல்வகை இயக்குதள எல்லைகளைத் தாண்டி எடுத்துச் செல்லவேண்டிய தேவை வந்தது. 'உரை/அஞ்சல்' பார்வையில் மட்டும் பன்மொழிக் கணிமை பார்க்கப்படும் நிலையிலிருந்து, இணைய உலாவிகளில் கையாளப்படுதல் என்ற கட்டத்துக்கு முன்னேறியது. இந்த நிலையிலும், உள்ளடக்கம் மட்டுமே மற்ற மொழியில் இருந்தது. ஆனால், கருவிகளும் கட்டளைகளும் இன்னும் ஆங்கிலத்தில், அல்லது சில குறிப்பிட்ட முன்னேறிய ('ஐரோப்பிய' என்றும் கொள்ளலாம்) நாடுகளின் மொழிகளில் மட்டும் செயல்பட்டன. 'இயங்கு எழுத்துரு' போன்ற இடைக்கால நிவாரணங்களைக் கொண்டு ஆங்கில/ஐரோப்பிய மொழிகளில் அமைந்த கருவிகள் மற்ற மொழிக்கும் செவிலித்தாயாக ஊட்டமளித்தன.
1.4 இன்றைய நிலை
பன்மொழிகளும் ஒரே இடத்தில், ஒரே கருவியில், ஒரே கோப்பில் ஒத்திருக்கவேண்டிய அவசியம் உணரப்பட்டு, யுனிகோடு குறியேற்றம் (encoding) வளர்ந்தது. சில சிக்கல்கள்/எதிர்ப்புகள் இருந்தும், கிடைக்கும் மற்ற அனுகூலங்கள் காரணமாக, இன்று யுனிகோடு பரவலாக வளர்வதைப் பார்க்கிறோம். இதே காலக்கட்டத்தில் மொழியாக்கங்களின் தேவையும் வளர்ச்சியடைந்திருக்கிறது. புதிய மென்பொருட்கள் ஆங்கிலத்தில்/ஐரோப்பிய மொழிகளிலிருந்து தமிழாக்கம் செய்யப்படும்போது யுனிகோடு சில புதிய சவால்களையும் விடுக்கிறது. வலைப்பதிவுகள் அமைக்கப் பயனாகும் 'நியூக்ளியஸ் சிஎம்எஸ்' (Nucleus CMS) என்ற உள்ளடக்க மேலாண்மை (Content Management System) மென்பொருள் தொகுப்பை தமிழாக்கம் செய்ததில் கட்டுரையாசிரியர் பெற்ற அனுபவங்கள், செய்த பின்னர் மனதில் தோன்றிய எண்ணங்கள், இத்தகைய முயற்சியில் ஈடுபடப்போகும் ஆர்வலர்களுக்கு யோசனைகள் ஆகியவை இங்கு பகிர்ந்துகொள்ளப்படுகின்றன.
2. மென்பொருள் பன்மொழியாக்கம் / தன்மொழியாக்கம்
பெரும்பாலான மென்பொருட்கள் ஆங்கில மொழியிலேயே (உருவாக்குபவர்கள் ஆங்கிலம் பேசுபவர்களாக இல்லாமல் இருந்தாலும் கூட) முதலில் உருவாக்கப்படுவதைப் பார்க்கலாம். யுனிகோடு வரும்வரை, இவை மற்ற மொழிகளையும் தாங்கிவருமாறு விரிவாக்கப்படும்போது கையாளும் முறையில் பெரிய அடிப்படை மாற்றங்கள் தேவைப்படவில்லை. செய்யவேண்டியிருந்ததெல்லாம்
-இடைமுகத்தில் இடம்பெறும் சொற்கள்/கோவைகளை மென்பொருளிலிருந்து பிரித்து, பட்டியலிடுதல்
-அந்தப் பட்டியலை ஒரு தனிக் கோப்பாக செய்தல்.


இந்தவகையில் ஒரு மென்பொருளை மொழியாக்கம் செய்ய, ஆங்கில மொழிக்கோப்புக்குப் பதிலாக அந்தக் குறிப்பிட்ட மொழிக்கான கோப்பை (language file) தயாரிப்பதே முதன்மைப் பணியாக இருந்தது.
ஆனால், யுனிகோடு இந்த எளிய முறையை சற்றுக் கடினப்படுத்திவிட்டது. ஒரு எழுத்துக்கு ஒரு பைட் என்ற எண்ணிக்கை அளவில் உள்ள மொழிகளுக்கு மட்டுமே இப்போது மேற்சொன்ன பழைய முறை பயனாகிறது. UTF-8 எனப்படும் நடைவரை(Protocol)யின்படி தமிழ் யுனிகோடு எழுத்துக்கள் (இங்கு 'எழுத்துக்கள்' என்பது, எளிமைக்காக உயிர்/மெய்/உயிர்மெய் எனப்பிரித்துப் பார்க்கப்படவில்லை) மூன்று-மூன்று பைட்டுகளாக வருவதால் வெறுமனே 'மொழிக்கோப்'பைத் தயாரிப்பதோடு நில்லாமல், மொழியாக்கம் மூலவடிவத்திலிருந்து வேறுபல மாற்றங்களையும் எதிர்பார்க்கிறது. 'இந்த முதல் நிலை மாற்றங்கள் தமிழுக்கு, தெலுங்குக்கு என்று வேறுபடாதவை' என்பது ஒரு பெரிய நன்மை. இவ்வாறு ஆங்கிலம்/ஐரோப்பிய மொழிகளை (ஒற்றை பைட் எழுத்துக்கள்) மட்டும் தாங்கும் வடிவத்திலிருந்து, பல-பைட் கொண்டு குறிக்கும் மொழிகளைத் தாங்கவைக்க, தேவைப்படும் மாற்றங்கள் செய்யப்பட்ட வடிவம் 'பன்மொழியாக்கிய வடிவம்'(International version) எனலாம். இந்த முதல் நிலை மொழியாக்க முயற்சிகளை 'பன்மொழியாக்கம்'(Internationalization) என்று குறிப்பிடலாம்.
இப்படி சரிவரப் பன்மொழியாக்கம் செய்யப்பட்ட ஒரு மென்பொருளை தமிழோ, குஜராத்தியோ எந்த மொழியில் வேண்டுமானாலும் எளிதில் மொழியாக்கம் செய்யமுடியும். இப்படி இரண்டாவது நிலையில் நடக்கும் மொழியாக்கத்தை 'தன்மொழியாக்கம்'(Localization) என்று குறிப்பிடலாம்.

நியூக்ளியஸ் சிஎம்எஸ் போன்ற, ஒருங்கிணைந்த தரவுத்தளத்துடன் (integrated database) இயங்கும் நிரலித் தொகுப்பு இவ்வாறு சரிவரப் பன்மொழியாக்கப்பட்டிருக்கவில்லையாதலால், இரு நிலைகளையும் செய்யவேண்டியிருந்தது. இந்த 'இரு-நிலை' பற்றிய தெளிவில்லாததால் சற்று சிரமப்பட்டே செய்யவேண்டியிருந்தது. அந்த அனுபவங்களில் சிலவற்றை இப்போது காண்போம்.
3. பன்மொழியாக்கம் - சில அனுபவங்கள்:
முதலில் நியூக்ளியஸ் சிஎம்எஸ் இயங்கும் விதம் பற்றி சிறு குறிப்பு:
மற்ற பிரபலமான உள்ளடக்க மேலாண்மை மென்பொருட்களைப் போலவே இதுவும் பல நிரல்களைக் கொண்ட ஒரு தொகுப்புடன், பின்னணியில் ஒரு தரவுத்தளம் கொண்டு இயங்குமாறு அமைக்கப்பட்டிருக்கிறது. எல்லாத் தகவல்களும் சேமிக்கப்படும் கிடங்காக தரவுத்தளம் விளங்குகிறது. கிடங்கிலிருந்து தேவையானதை எடுத்து, தேவையான வடிவத்தில், உலாவிகளுக்கு வழங்கும் வேலையை நிரல்கள் செய்கின்றன. அதேபோல உலாவி வழியாகவே இந்த புது உள்ளடக்கத்தை சேர்த்தல், இருப்பதை மாற்றியமைத்தல் ஆகியனவையும் நிரல்கள் செய்கின்றன. இந்த நிரல்கள் இணைய வழங்கிகளுக்கான, மிகப் பிரபலமான திறமூல மொழியான பிஹெச்பி(PHP) மொழியில் அமைக்கப்பட்டிருக்கின்றன. அதேபோல இன்னொரு பிரபலமான திறமூலத் தயாரிப்பான மைஎஸ்க்யூஎல்(MySQL) தரவுத்தளத்துக்குப் பயனாகிறது. ஒரு டச்சுக்காரரால் தொடங்கப்பெற்ற இந்த மென்பொருள், பல மொழிகளைக் கையாள ஒரு 'மொழிக்கோப்'பை சுட்டிக்காட்டி, அதை மொழியாக்கம் செய்தால் போதும் என்ற பிம்பத்தை ஏற்படுத்தியிருந்தது. அது மட்டும் ஏன் போதவில்லை என்பது சில உதாரணங்களால் விளக்கப்படுகிறது.
3.1. தரவுத்தளத்தில் தேவைப்பட்ட மாறுதல்கள்:

பல சேமிப்பு முறைகளின் பைட் அளவுகள்
தரவுத்தளத்தில் முதல் மாற்றங்கள் யுனிகோடின் பைட்-கணக்கால் விளைந்தன. உதாரணமாக, 'வலைப்பதிவின் தகவல்கள்' என்ற அட்டவணையில், 'தலைப்பு' என்ற தரவு 80 பைட்டுகள் என்ற அளவில் அமைக்கப்பட்டிருந்தது. 'சித்தூர்க்காரனின் சிந்தனைச் சிதறல்கள்' என்ற 22 'தமிழ்' எழுத்துக்கள் கொண்ட தமிழ்த்தலைப்பு UTF-8 நடைவரையில் சேமிக்கப்பட்ட யுனிகோடில் 107 பைட்டுகள் இடம் பிடிக்கிறது. முன்னிருந்த 80 பைட் அளவு கொண்ட அட்டவணையில் எப்படி இதை அடக்கமுடியும்? இதுபோலவே எங்கெல்லாம் குறிப்பிட்ட எண்ணிக்கையில் பைட் அளவுகள் கொண்டு குறிக்கப்பட்டிருந்ததோ அங்கெல்லாம் குறைந்தது மூன்றுமடங்காக மாற்றி அமைக்கவேண்டியிருந்தது. இது மொழியாக்கத்துக்குப் பரிந்துரைக்கப்படாத நிரல்களை சிதைப்பதன்(hacking) மூலமே சாத்தியமாயிற்று.
3.2. குறியேற்ற அறிவிப்பு பற்றிய மாறுதல்கள்:
'மொழிக்கோப்'பில் 'குறியேற்றம்'(encoding) என்ற தரவு மாற்றப்படக்கூடியதாய் காட்டப்பட்டிருந்து, அதை UTF-8 என்று மாற்றியும் எல்லா இடங்களிலும் தீர்வு கிடைக்கவில்லை. ஏனென்றால், மொழிக்கோப்பில் கொடுக்கப்படும் குறியேற்றம், வலைப்பதிவின் வாசகர் காணும் பக்கங்களுக்கு மட்டுமே பயனானது. உள்ளடக்கத்தை சேர்க்க, மாற்றி அமைக்க ஒரு வலைப்பதிவர் கையாளும் பக்கங்கள், பல நிரல்களுக்குள் நேரடியாக ISO-8859-1 என்ற ஒற்றை பைட்டைத்தாங்கும் குறியேற்றமாக அமைப்பிக்கப்பட்டிருந்தது. இதனால் யுனிகோடில் உள்ளிடப்படும் தகவல், உலாவியால் NCR (Numeric Character Reference) எனப்படும் குறியீட்டு எண் கொண்டு குறிக்கப்பட்டது. 'போனால் போகிறதென்று மூன்று பைட்டில் குறிக்கலாம்' என்ற சமாதானத்தையும் சீண்டிப்பார்க்கும், ஒரு எழுத்துக்கு ஏழுபைட் விழுங்குவதான முறை இது. அத்துடன், இவ்வாறு NCR வடிவத்தில் சேமிக்கப்பட்ட உள்ளடக்கத்தை மறுபடி மாற்றி அமைப்பது இன்னொரு பெரும் சவாலாகும். எனவே பல நிரல்களிலும் தேடி, அவற்றின் குறியேற்றங்களை UTF-8 என்று அறிவிக்கவேண்டியிருந்தது, இன்னொரு சிதைப்பே.
3.3. முன்னிருப்புத் தகவல்கள்(default data):
தரவுத்தளத்தில் பெரும்பாலான அட்டவணைகளில் முன்னிருப்புத் தகவல்களாக இருப்பவற்றை தமிழில் செய்ய சிரமப்படவேண்டியிருந்தது. அதிலும் குறிப்பாக install.sql என்ற கோப்பு மிகவும் தொல்லை கொடுத்தது. இதற்குள் சென்று ஒவ்வொரு இடமாகத் தேடித்தேடி சொற்களையும், சொற்றொடர்களையும் தமிழ்ப்படுத்தி நோட்பேடில் சேமித்தும், நிறுவும்போது பிழையாகவே காட்டிகொண்டிருந்தது. அப்போதுதான் நோட்பேடு செயலி சத்தமில்லாமல் செய்யும் ஒரு இடைச்செருகல் வேலை தெரியவந்தது.

சிவப்புக் கட்டத்துள் இருப்பவை நோட்பேடின் இடைச் செருகல்கள்
மைக்ரோசாப்ட் வேர்ட் (MS Word) போன்ற ஆவணத் தொகுப்பான்களுக்கும், நோட்பேட் போன்ற எளிய உரை தொகுப்பான்(plain text editor)களுக்கும் முக்கிய வேறுபாடு உள்ளது. திரையில் காட்டப்படுபவற்றுக்கு மேலதிகமாய் ஒரு பைட் கூட, வட்டில் சேமிக்கப்படும் கோப்பில் ஒரு எளிய உரை தொகுப்பான் சேர்க்காது. மனிதர் வாசிக்க முதல் வகை, கணினி வாசிக்க இரண்டாம் வகை. நிரல்கள் தொகுக்க இரண்டாம் வகையையே பாவிக்கவேண்டும், ஏனென்றால் எந்த அலங்காரமும் (சாய்வெழுத்து, அடிக்கோடிடல், போன்றவை) இன்றி உரை இருந்தால்தான் கணினி பிழையின்றி வாசிக்கும். யுனிகோடு UTF-8 குறியேற்றத்தில் சேமிக்கும்போது, நோட்பேடு, இந்த விதியை சொல்லாமல் மீறுகிறது. ஒவ்வொரு யுனிகோடு எழுத்தையும் மூன்று பைட் தொடர்களாக சேமிப்பதோடு, 'இந்தக் கோப்பு UTF-8-ல் இருக்கிறது' என்று, தான் மறுமுறை திறக்கும்போது தெரிந்து கொள்வதற்காக, இன்னும் மூன்று பைட்கள் கொண்டு ஒரு அடையாள முத்திரை(signature)யை, கோப்பின் தொடக்கத்திலே நோட்பேடு ஒளித்துவைக்கிறது. இதைத் தெரிந்துகொள்ள சில காலம் பிடித்தது. தெரிந்தும், இதை நீக்குவது எப்படி என்று அறிந்துகொள்ள இன்னும் கொஞ்சம் சிரமப்படவேண்டியிருந்தது. ஆனால் இம்மாதிரி சிறிய விஷயங்களை கஷடப்பட்டுத் தெரிந்துகொண்டது பிறகு இதே பிஹெச்பி கொண்டு பின்னாளில் பல நிரல்கள் செய்யும்போது நன்கு பயன்பட்டது.
3.4. RSS செய்தியோடை (newsfeed):
அடுத்து இன்னொரு சிக்கலும் இருந்தது. அதுவும் மூன்று-பைட் யுனிகோடால் வந்தது. செய்தியோடையில் வலைப்பதிவின் தலைப்பும் சாரமும் மட்டும் காட்டப்படும் வசதி உண்டு. இந்த 'சாரம்'(excerpts) என்பது முதல் X எழுத்துக்கள் (உண்மையில் பைட்கள்) என்று அமைப்பிக்கப்பட்டிருந்தது. யுனிகோடு எழுத்துக்களைப் பொருத்தவரை மூன்று-பைட் கூட்டணியை உடைத்துவிட்டோமானால் செய்தியோடை பாழ்பட்டுவிடும். feedvalidator போன்ற சோதனையில் நிராகரிக்கப்படும். ஆகவே இப்படி X பைட்கள் கொண்ட சாரம் செய்வதைத் தவிர்த்து சொற்றொடரின் இறுதியில் முடியுமாறு செய்யவேண்டியிருந்தது. அதன்பின்னரே பாழ்படாத செய்தியோடை கிட்டியது.
இவ்வாறு ஆங்கில/ஐரோப்பிய ஒற்றை-பைட் மொழிவடிவத்திலிருந்து யுனிகோடுக்குத் தகுதியான மூன்றுபைட் utf-8 வடிவமாக்கவே நிறைய உழைப்புத் தேவைப்பட்டது. நல்லமுறையில் பன்மொழியாக்கப்பட்ட மென்பொருள் இத்தனை வேலை வாங்காது. மென்பொருள் மொழியாக்கம் செய்யத்தலைப்படுபவர்கள் பன்மொழியாக்கிய வடிவத்தைத் தேடிக் கண்டுபிடித்து அங்கிருந்தே தங்கள் பணியைத் தொடங்குவது மிக அவசியம் என்பது இதன்மூலம் தெளிவாகிறது.
4. தன்மொழியாக்கம் - சில அனுபவங்கள்:
மொழிக்கோப்பை தமிழாக்கம் செய்தாயிற்று, மற்ற யுனிகோடு சம்பந்தப்பட்டவற்றையும் சரிசெய்தாயிற்று, ஆனாலும் நிறுவியபின்னர், காணும் இடங்கள் பலவற்றில் தமிழும் ஆங்கிலமும் கலந்து வந்தது. அப்போதுதான் மொழிக்கோப்பில் இல்லாமல் பல இடங்களில் இன்னும் ஆங்கிலச் சொற்கள் இருந்தது புலனானது. மீண்டும் தேடித்தேடி அவற்றைத் தமிழ்ப்படுத்தியாயிற்று.
அதற்குப் பின்னரே இன்னொரு சிக்கல் விளங்கியது.
4.1. மூன்று பயனர் நிலைகள்:
இம்மாதிரி உள்ளடக்க மேலாண்மை மென்கலன்கள் மூன்று நிலையில் பயனர்களுடன் தகவல் பரிமாறுகின்றன. அவை:
4.1.1. வாசகர்

இந்த மென்கலனை நிறுவி, ஒரு வலைப்பதிவை உருவாக்கி, பல இடுகைகள் எழுதப்பட்டபின் வந்து பார்த்து வாசித்து, விருப்பப்பட்டால் மறுமொழி எழுதுபவர். இவருக்குத் தெரியும் திரைகள் கட்டாயம் தமிழில் இருக்கவேண்டும். உதாரணத்துக்கு 'மறுமொழி இட', 'மேலும் வாசிக்க' என்ற வாசககங்கள் தமிழில் இல்லாவிட்டால் இது ஒரு தமிழ்த்தளம் என்ற எண்ணமே இராதுபோகும். நியூக்ளியஸின் மொழிக்கோப்பில் இந்த நிலையில் உள்ள பயனருக்குப் பொருந்தும் 80% சொற்களே இருந்தன. கொஞ்சம் தேடி மீதத்தையும் மாற்றி அமைத்தாயிற்று. இந்த நிலையில் கலைசொற்கள் பெரிய சவாலாக இல்லை.
4.1.2. வலைப்பதிவர்:

ஒரு வலைப்பதிவர் தன் வலைப்பதிவை மேலாண்மை செய்ய சில கட்டளைகள் கையாளவேண்டியிருக்கிறது. இங்கே பல கலைச்சொற்கள் சவாலாக இருந்தன. தமிழில், முக்கியமாகக் கணியியலில் கலைசொற்கள் அரிதாகவே இருந்தன. இருந்தவற்றிலும் ஒரு தகுதரம் ஏதும் செய்யப்படாததால், ஒரே சொல்லுக்கு பல மொழியாக்கம், பல சொல்லுக்கு ஒரே மொழியாக்கம், என்று துல்லியமின்மை, பெரும் சவாலாக இருந்தது. சில சொற்களுக்கு நேரடித் தமிழ்ச் சொல் இருந்தபோதும், அதன் பயன், சொல்லின் உட்பொருள் ஆகியவற்றை உணர்ந்து தமிழ்ச் சொல் பயன்படுத்தும்போது மொழியாக்கம் எளிமையோடு வலிமை பெறுகிறது. உதாரணமாக, பக்கத்தின் அழகை தீர்மானிக்கும் skin என்ற ஆங்கிலச்சொல்லுக்கு, 'தோல்' என்ற நேரடிச் சொல் இருந்தாலும், 'ஆடை' என்ற சொல் மிகப்பொருத்தமாக இருப்பதைச் சொல்லலாம். பக்க அழகை மாற்ற, ஆடையை மாற்றச் சொல்வது, தோலை மாற்றச் சொல்வதைவிட பொருத்தமானதுதானே!
4.1.3. நிர்வாகி:

மென்கலனை நிறுவுதல், அடிப்படை அமைப்புக்களில் மாற்றங்களை செய்தல், வலைப்பதிவர் கணக்குத் துவங்குதல், தரவுத்தளத்தை பின்சேமித்தல்/மீட்டெடுத்தல்(backup/restore database), போன்றவை நிர்வாகியின் வேலை. இன்றைய தேதியில் கணினியியலில் தமிழ் புழங்கும் யதார்த்தத்தை மனதில் வைத்துப்பார்த்தால், இந்த நிலையில் உள்ள கலைச்சொற்களை மட்டுமல்லாமல், நிர்வாகிக்கான மொத்த இடைமுகத்தையுமே ஆங்கிலத்தில் விட்டுவைத்தல் சாலச் சிறந்தது. இது கட்டுரையாசிரியருக்கு தாமதமாக உதித்த ஞானோதயம். கடினமான தமிழ் இடைமுகமே இந்த மென்கலனை பயன்படுத்த தடையாக இருக்கக்கூட வாய்ப்பிருக்கிறது. எனவே இன்னும் மேம்பட்ட முயற்சிகளும் பயன்பாடும் வரும்வரை, இந்த நிலையில் உள்ள இடைமுகத்தை தமிழாக்கம் செய்வது விரும்பத்தக்கதல்ல.
4.2 சூழல் மாற்றி அமைப்பித்தல் (setting up the locale)
இத்தனை செய்தும், கிழமையும் மாதமும் தமிழில் வரவைக்கத் தெரியவில்லை. இணையவழங்கி(webserver)யும், பிஹெச்பி நிரல்செயலி(PHP processor)யும், தரவுத்தளமும் (Database) பன்மொழித்திறனோடு நிறுவப்பட்டிருந்தால் இவற்றைத் தமிழில் கொண்டுவருதல் வெறும் சொடுக்குப் போடும் நேர வேலை! ஆம், சூழல்(locale) என்ற அமைப்பை ta_IN.UTF-8 என்று மாற்றியதும் அடுத்த நொடியில் எங்கெல்லாம் கிழமையும் மாதமும் காட்டவேண்டுமோ அங்கெல்லாம் தானாக 'ஜனவரி', 'வெள்ளி' என்று யுனிகோடு தமிழில் வந்தது. கட்டுரையில் பேசப்படும் மொழியாக்கம் செய்ததிலேயெ மிக இனிய அனுபவம் என்று இதைச் சொல்லலாம்.
5. முடிவுரை:
'அனுபவம் என்பது உனக்கு நேர்ந்தல்ல, உனக்கு நேர்ந்ததை நீ எப்படி எதிர்கொண்டாய் என்பதே' என்று ஒரு அறிஞர் சொன்னாராம். அதைப்போல இந்த மொழியாக்க அனுபவம் இன்னுமொரு முறை இம்மாதிரி தேவை வந்தால் எதைச் செய்யலாம், எதைச் செய்யக்கூடாது என்று ஓரளவுக்கு விளங்கிக்கொள்ள உதவியது. இதில் ஈடுபட்டதற்குப்பின் தோன்றிய சில எண்ணங்கள்:
- பன்மொழியாக்கம் செய்யப்பட்ட வடிவம் இருக்கிறதா என்று தேடி அங்கிருந்து தொடங்கவேண்டும்.
- அப்படி இல்லாவிடில், தெளிவாக, பன்மொழியாக்கம் மட்டும் செய்து ஒரு பதிப்பு சேமித்துவிட்டு, பிறகு தன்மொழியாக்கம் செய்யவேண்டும். இப்படி நாம் பன்மொழியாக்கம் செய்ததை மற்றவர்கள், குறிப்பாக மற்ற இந்திய மொழியினருக்குக் கொடுத்து, அவர்களுக்கு அங்கிருந்து ஆரம்பிக்கச் செய்வது, செம்மொழியாம் தமிழ் இம்மாதிரி முயற்சிகளில் உன்மையிலேயே முன்னோடியாக இருப்பதைப் பார்த்து தானாக அவர்கள் நம் மொழியின்மேல் மரியாதையை வளர்க்கவும் உதவும்.
- எல்லா நிலையிலும் உள்ள கலைச்சொற்களை தமிழாக்கம் செய்து கடினப்படுத்தி, 'ஆபரேஷன் சக்சஸ், பேஷண்ட் அவுட்' என்ற சிரிப்புக்கு இடமாகிவிடுவதை விட நடைமுறையைப் பிரதிபலிக்கும் அளவுக்கு தமிழாக்கம் செய்யவேண்டும்.
பின்குறிப்பு: கட்டுரையாளர் தொழில்முறை மென்பொருளாளர் அல்லர். எனவே அவரின் அனுபவங்கள்/எண்ணங்கள் எல்லா இடங்களுக்கும் பொருந்தாமல் போகலாம்.
எழுதப்பட்ட நாள்: நவம்பர் 19, 2004