Read Microsoft Word - 34 NTNhan-NTVIet-Tam nhin Nom.doc text version

thi i mi

TP CHÍ NGHIÊN CU & THO LUN

S 5 Tháng 7/2005

Mt cách nhìn v tng lai ca ch Nôm

Ngô Thanh Nhàn, i hc New York, [email protected] Ngô Trung Vit, Vin Công ngh Thông tin, [email protected] Hi ngh Quc t v ch Nôm Ngày 12-13 tháng 11 nm 2004 Th vin Quc gia Vit Nam ­ Hà Ni

Tóm tt

Bài này a ra mt s nhn xét v nhng tin trin trong vic nghiên cu, in n, ph cp s dng ch Nôm trong nhng nm gn ây, c v s lng, cht lng, ngi và ca, trong và ngoài nc. S tin trin này c bn không tách ri tin trin chung ca k thut x lý a ng, tra cu mng, kin thc ngôn ng hc, và kin thc x lý vn bn, và nhng chính sách thích hp. Theo ý chúng tôi, trung tâm ca s tin trin này là b mã chun Unicode và ISO/IEC 10646 mà Vit Nam ã quyt nh tham gia t u nhng nm 1990. C bn ca cách nhìn v tng lai ca ch Nôm là chun mã (codepoints), dng chính tc (canonical forms), cu phn c bn (basic components) và b sung thêm kho (repertoire) ch Nôm dành cho mi loi nghiên cu và s dng rng rãi, trên c s tra cu (search) mng internet. T mt b mã chung qua mng, thông qua tiêu chun Vit Nam, mà nhng nhà nghiên cu, giáo dc, bo tn, bo tàng, th vin, v.v. có th ngh n nhng tin trin xa hn, trong tri thc tp th ca cng ng Vit Nam và th gii. Vic này không th làm c nu chúng ta không có mt chng trình a các vn bn vn hoá quan trng ca Vit Nam vào mt kho lu tr quc gia mà ai cng tham kho c. Do ó, bài này phác ho mt s hoàn cnh c bn và nh hng tin ti mt tng lai mà chúng tôi cho là mc nhiên--trong ó, chúng ta không mt nhng tài sn tri thc có th mt, ly li nhng tài sn tri thc ã mt, và làm cho s và c trng ca dân tc Vit Nam hin l vi y chng c.

Thi i Mi S 5 Tháng 7/2005

2

1. Bi cnh

Vit Nam là mt quc gia có lch s và vn hoá lâu dài hàng nghìn nm. Nhng phát hin mi ây v di tích Hoàng thành ti Ba ình, Hà Ni càng làm cho chúng ta có cm giác t hào v mt nc Vit Nam vi truyn thng lâu dài. Nhiu giá tr vn hoá c truyn ang c phc hi và phát trin tr li cho dân tc nhng chng c, nhng iu tng chng nh b mai mt trong quá kh và trong nhng bin chuyn xã hi ln lao ca th k th 20. Ch Nôm chính là mt trong nhng giá tr ó và hin ang c khôi phc tr li v trí xng áng ca nó nh mt mnh t lu gi nhiu vn vn hoá c, nhiu tri thc, hiu bit, phong tc, cách nói c... Hn bao gi ht, xã hi Vit Nam ngày nay ang quan tâm ngày càng nhiu ti vic phc hi ch Nôm, không phi nh mt vt phm kho c c trng by bo tàng mà là mt tri thc dân tc sng ng trong con ngi và cng ng. S quan tâm ca c cng ng nói chung, nht là ca gii tr nói riêng i vi vic khôi phc và s dng ch Nôm hin ã tng lên rt nhiu, nht là qua các phng tin k thut hin i. S quan tâm ca th h tr vi ch Nôm trên nn công ngh hin i ha hn tng lai khác hn cho ch Nôm trong tin trình vn hoá dân tc. Thanh thiu niên Vit Nam mi ni bt u chú ý n vn ch Hán Nôm--coi ting Vit có hai cách vit, mt cách theo la-tinh, mt cách theo ch biu ý. C hai u c gi là ch quc ng--ch Hán Nôm c gi là quc ng trong quá kh, ch Vit la-tinh c gi là ch quc ng t u th k th 20. Công ngh thông tin (CNTT) vi nhng bc tin ph cp máy vi tính và phát trin mng máy tính toàn cu ã tr thành phng tin hu hiu cho vic khôi phc và ph cp s dng ch Nôm. Máy tính hin i ngày càng có nng lc x lí nhiu ngôn ng và ch vit phc tp, nói riêng ã có kh nng x lí c cho ch biu ý, ch Nôm t u nhng nm 1990. Các chun a ng quc t ã a nhiu tin b công ngh vào ph cp giúp cho vic khôi phc và gìn gi các giá tr vn hoá c. S thâm nhp ca CNTT vào các hot ng nghiên cu và bo tn di sn Hán Nôm ã và ang phát trin mnh trong vòng hn mt chc nm qua. Trong hn mi nm qua ã có nhiu c gng và n lc ca các cá nhân và tp th a tin b công ngh vào vic phc hi v trí xng áng ca ch Nôm. Nói riêng, mi vic chun b cho các máy tính hin i có th x lí c ch Nôm ã c bt u t nm 1992 vi vic Vit Nam yêu cu t chc tiêu chun quc t xem xét a ch Nôm ca Vit Nam vào b kí t toàn th gii Unicode và ISO/IEC 10646. Và t ó, Vit Nam ã tham gia phát trin chun quc t Unicode và ISO/IEC 10646, vi mc ích a ch quc ng la-tinh, ch Nôm, và các ch dân tc Vit Nam vào b kí t quc t. Nhng tin b công ngh mi v phn mm và mng máy tính cho phép ph cp và phc hi vic s dng di sn ch Hán Nôm ã tng b quên lãng trong gn 100 nm qua. Ch Nôm ã xut hin trên màn hình mng toàn cu trc con mt y ngc nhiên ca nhiu em nh, iu mà các em thm chí còn cha h c nhìn thy qua sách hc chính thc ca các lp ph thông, mc du vn thy chúng trên các câu i, hoành phi. Ch Nôm cng bt u bc vào lnh vc xut bn in t vi vic ra i M cun th H Xuân Hng, in bng ch Nôm, ch quc ng và ch ting Anh, vào nm 2000. Và trong nm nay cun Giúp c Nôm Hán Vit ca Linh mc Anthony Trn Vn Kim tra cu ch Nôm, c in dùng phông ch Nôm trên máy tính, cng ã c xut bn. Trên th gii mt b phông cho ch Hán Nôm ca nhóm o Uyn cng ã c ph bin. Trong nc, ã xut hin nhiu trang web cho phép tra cu và s dng ch Nôm nh ca HueSoft, HaNoSoft. Ti M, Hi

Thi i Mi S 5 Tháng 7/2005

3

Bo tn Di sn ch Nôm thng xuyên duy trì trang web có chng trình tra cu các ch Nôm mà Vit Nam ã ng kí vi th gii. Tt c các h phn mm u dùng ch quc ng la-tinh song song vi ch Hán Nôm. i vi nhng nhà nghiên cu, vic có kh nng s dng, in n, truy nhp thông tin ch Nôm trên máy tính ã m ra mt chân tri mi cho nhng nghiên cu mi theo hng tng hp toàn din mi khía cnh ã thu thp c ca ch Nôm. ây là mt iu kin ht sc lí tng mà không phi ngi nghiên cu nào trc ây cng có th có c. Hin nay yêu cu tri thc v ch Nôm là CNTT phi phn ánh c c thù ca cu to, ni dung và s dng ch Nôm. Ví d: Trong quá kh, ngi Vit ã sáng to ch Nôm ghi li ting Vit. Trong tin trình ó, h ã dùng ch Nôm mô t các c tính ca ting Vit: mt th ting n âm (mi ting là mt âm tit, và c ghi bng mt ch). Vì s ting gii hn, ch khong 6.700, ngi Vit ã dùng loi t và ng cnh (ta còn gi là nét ngha) phân bit cách các ting cùng âm khác ng cnh. Các nét ngha này c ghép thng vào các hình ch ghi âm. Cách dùng ch Nôm nh th chng nhng ghi li c các phng ng ting Vit mà còn có các ngha khác nhau ca ting. Ví d, ch "a" c dùng ghi 44 ch sau ây theo c s tri thc kèm theo b phông Nôm Na, Tng th, dng mnh, NomNaTongLight (phiên bn 1.0):

b, da [a + bì] U+63010 bn [a + bn] U+215b1 cu [câu + a] U+0591f da [nhc + a] U+043e7 dm [bm + a] U+215cb a [m + a] U+25e60 a [iu + a] U+2a013 á [túc + a] U+08de2 i [kh + a] U+20afe [thu + a] U+23d19 a [th + a] U+062f8 a, sy, xy, xy, xi, x [nhân + a] U+04f88 a [a + inh] U+635af ghi [c/ki + a] U+635bd lm [lm + a] U+635be loã [qu + a] U+05925 nhiu [nhiêu + a] U+635bf quên [a + mai] U+635bb rm [a + rèm] U+635bc

bn [a + bn] U+635b4 cu [a + câu] U+05920 ci [a + cái] U+635b1 day, di, dây, dê, di, giay, ri [hoà + a] U+079fb dm [bm + a] U+60134 a [mc + a] U+06818 á, , , a [thch + a] U+254a5 e, , , s, x [khu + a] U+054c6 i [a + kh] U+634db a [xc + a] U+08ffb a [a + tng] U+635b9 a [inh + a] U+20032 [trc + a] U+63029 lai [lai + a] U+635b5 lm [thm + a] U+05926 nhèo, nhiêu [nghiêu + a] U+215c9 nhóm [chim + a] U+215a1 rng [lng + a] U+635b6 sai [sai + a] U+215c2

Thi i Mi S 5 Tháng 7/2005

4

sánh [á + a] U+215bc ta [ph + a] U+07239 tm [a + tm] U+215ce

si [mc + a] U+07735 try [l + a] U+63052 vai [a + mai] U+635ba

Các chuyên gia CNTT có th có nhng nhn xét sau ây : Nhng ch nh "cu" , "i" hay "a" , có th vit hai cách khác nhau, và b phn "a" t do kt hp trong khung vuông. S t do này cho thy ngi Vit xem khung vuông là vùng kt hp lng. Nhng ch nh "bn" , "a" , "á" , "a" , "i" , "lm" , ... có cùng b phn "a" nhng khác b phn kt hp cho thy cách gii quyt c bit vn cùng âm khác ngha trong ch Nôm mà chúng ta không thy trong ch quc ng la-tinh.

2. Nhng thành tu ã t c

có c nhng kt qu nh ngày hôm nay chúng ta thy i vi ch Nôm, chúng ta ã phi mt nhiu công sc, lao ng và tin bc. Nhng u t ó vào ch Nôm không bao gi phí hoài, trái li nó ã thúc y s quan tâm ca c cng ng vi vn vn hoá ch Nôm mà có thi ã tng b coi là không còn giá tr s dng gì na. Sau ây xin im li mt s kt qu chính ã thu c: Mã hoá: Trong 12 nm t 1992-2004 chúng ta ã kiên trì theo ui các kì hp quc t yêu cu a ch Nôm vào b kí t th gii Unicode và ISO/IEC 10646. Chúng ta ã a vào 5.067 ch trùng hình vi ch CJK Trung-Nht-Hàn trong mt phng c s BMP, 4.232 ch trong mt phng 2, và hin ang ngh a vào thêm 2.200 ch na. Nh vy s ch Nôm rút t ngun t liu tht ã c ng kí vi t chc tiêu chun th gii là khong trên 11.500 ch. Phông Nôm: Thc t trong s dng hin nay trên các máy tính, mi ch có b phông Arial Unicode MS cha khong hn 5.000 ch Nôm trùng hình ch Hán. Vin Vn T Kính Mojikyo ti Nht Bn ã làm ra phông ch TrueType cho 9.299 ch Nôm mà Vit Nam ã có trong b mã quc t. Công ti DynaLab ài Loan có tr s ti Thng Hi và Hng Kông ã xây dng b phông Tng th DFSongLight_Vietnam2.ttf cng cho 9.299 ch Nôm này. Nhóm o Uyn ( Quc Bo ti c và Thin vin Viên Chiu) ã phát trin b phông HanNom (trên 30.000 ch) có th s dng trên mng. Nhóm Nôm Na ã phát trin b phông TrueType NomNaTongLight.ttf (trên 17.700 ch) Phn mm: ã phát trin phn mm tra cu ch Nôm gi là Nôm Lookup Tool (NLT) c s dng rng rãi trên mng c trong nc và trên th gii. Các phn mm gõ ch Nôm và phn mm t in ã c mt s nhóm chuyên gia tin hc trong nc phát trin: các nhóm ca Phan Anh Dng (Hu) và Tng Phc Khi-Lê Anh Minh (tp H Chí Minh). In n: ã thc hin vic in n ch Nôm t máy tính cho mt s b t in ch Nôm. Nhiu tác phm ch Nôm ã và ang c in n trc tip t máy tính và tra cu trên mng.

Thi i Mi S 5 Tháng 7/2005

5

3. Các xu hng phát trin tng lai cho ch Nôm

Trên c s nhng kt qu ã t c nh s kt hp ca hc gi ch Nôm và các chuyên gia CNTT, chúng ta có th phóng tm nhìn vào tng lai hình dung mt s xu hng phát trin sp ti và nh hng cho các hot ng nghiên cu, trin khai sp ti. Các góc nhìn s cp ti vic phát trin s dng ch Nôm, vic thúc y các nghiên cu ch Nôm vi s h tr ca công ngh, vic m rng các ng dng x lí có liên quan ti ch Nôm cho các lnh vc th vin, kho t liu và bo tàng. 3.1 Ph cp ch Nôm qua máy tính Ngi ta thng cho rng ch Nôm t xa ti nay không phi là th ch c ph cp rng rãi, vì nó khó hc, phi nh nhiu, và cn có vn ch Hán nào ó. Thi xa, làng nào có truyn thng hiu hc thì mi có thy dy ch Hán-Nôm cho tr trong làng. Thy dy ch Nôm không có tiêu chun i hc làm thy hay kin thc giáo dc. Thi nay, s ngi bit và có th dy c ch Nôm ngày càng ít i, nhng bù li, nh s hoàn chnh ca ch quc ng latinh, công ngh phát trin ã to kh nng có c các ông thy o trên máy tính, có th giúp cho mi ngi hc c ch Nôm qua máy tính có phng pháp. Và gii tr rt nhanh nhn, tháo vát trong vic tip thu nhng tri thc, k nng mi, cng không thy khó khn gì khi cn hc ch Nôm trên máy tính. Do ó song song vi quá trình ph cp tin hc, ph cp máy tính trong c nc, vic to ra kh nng các em nh c tip xúc và hc hi ch Nôm trên máy tính và trong giáo trình c s s to iu kin làm cho ch Nôm sng li trong tâm trí các th h tr. Ch Nôm s trng tn vi lch s khi các th h tr vn còn say mê tìm hiu và hc tp v ch Nôm. Xã hi và nn giáo dc cn trang b cho mi hc sinh nim t hào v di sn vn hóa ch Nôm, các em cn c thy ch Nôm trong các sách giáo khoa ph thông. Nh vy vic ào to nhng th h tr bit s dng ch Nôm và CNTT trong thc t là iu quan trng và cn thit. Và vic bo tn, duy trì vn vn hoá ch Nôm này ngay trong nhng ngi sng, nhng ngi tr, chính là cách thc bo tn hu hiu nht và không mt i c. Khi mà xã hi phát trin, i sng c nâng cao thì nhu cu hc và dùng ch Nôm trong các hot ng vn hóa s càng ln. S ti lúc tiêu chun này tr thành tiêu chun cho con ngi có vn hóa và am hiu vn hóa dân tc: ngi bit và s dng c ch Nôm trên máy tính. ph bin các t liu ch Nôm cho mi ngi có nhu cu, cn phát trin các kho lu tr các vn bn Hán-Nôm dng in t cp quc gia, a phng và gia ình, ph bin min phí qua mng. Chính vic nhiu ngi có kh nng truy nhp và s dng trc tip các ngun t liu c ch Hán-Nôm là mt m bo chc chn cho s trng tn ca nhng vn vn hoá c này. Vic ct gi chu áo các vn bn c trong các bo tàng chc chn mi ngi chiêm ngng cng là mt hình thc bo tàng, nhng cách gìn gi ch ng hn c là làm cho vn vn hoá ó sng ngay trong tâm khm ngi Vit. Và ó là mt trong nhng mc ích, ch yu ca vic ph bin mi tài liu ch Nôm cho mi ngi có nhu cu. thc hin c tm nhìn ph bin ch Nôm trên máy tính này, ngoài nhng c gng v mt công ngh, nhng c gng phát trin phn mm khai thác và x lí ch Nôm trên máy tính, cn thúc y trin khai các ng dng CNTT liên quan ti th vin và lnh vc bo tn di sn ch Nôm. Khi xut hin thêm các nhu cu trin khai ng dng cho ch Nôm trên máy tính và mng, thì ó s li là ng lc thúc y thêm na các nhà sn xut phn mm a ra th trng các sn phm phn mm x lí tt hn cho các ng dng c thù ch Nôm.

Thi i Mi S 5 Tháng 7/2005

6

dùng c ch Nôm t xa u phi có nhng ngi am hiu khá k v ch Hán. Ngày nay mt tình hung ngc li ang phát sinh: nhiu ngi tr rt am hiu máy tính và mong mun i vào tìm hiu ch Nôm qua máy tính. Nhng ngi già bit v ch Hán-Nôm li thng không hiu bit làm ch và s dng máy tính. Vì vy mt tm nhìn mi i vi s phát trin ca ch Nôm trong thi hin i là thúc y vic làm ch ch Nôm ca th h tr, nhng ngi ã c công ngh trang b cho nhiu tri thc tng hp v ch Nôm, thông qua các c s d liu ch Nôm c thit lp trên máy tính, h s tr thành nhng ngi nghiên cu và bo tn ch Nôm trong tng lai. Do ó vic phát trin và xây dng các giáo trình v ch Nôm và CNTT tr thành mt òi hi ca thc t hin nay. Thiu s u t công sc và hiu bit cho lnh vc này s làm chm li vic ph cp ch Nôm cho lp tr. 3.2 Nghiên cu v ch Nôm Bên cnh vic ph cp kh nng tip xúc vic hc ch Nôm, vic truy nhp vào các kho t liu ch Nôm, thì vic hình thành cách nghiên cu mi v ch Nôm da trên nhng tin b công ngh cng là mt tm nhìn mi cn c thit lp và ph bin trong gii nghiên cu. 3.2.1 Phát trin phng pháp lun làm vic mi vi ch Nôm da trên CNTT Vn ln nht là làm th nào các nhóm nghiên cu có th trao i tho lun các ch v ch Nôm trên mng. Mun làm c vic này phi làm gì? Cn có s thng nht v biu din ch Nôm trên máy tính sao cho khi thông tin v ch Nôm truyn qua mng máy tính, ngi gi và nhn vn có th c c úng thông tin ch Nôm ã c gi. Trong công ngh thông tin, không th có tin b vi s tham gia ca nhiu ngi nhiu ni, nu không có chun trao i tri thc tp th. Chun là mc ánh du tin b trong làm vic tp th. Do ó các nghiên cu v ch Nôm cn da trên vic thng nht v mt s chun trao i thông tin. Trong trng hp có nhng bt ng khi xem xét ch Nôm, mi kh nng biu din bt ng u cn c bo lu và th hin trên máy cho phép nhiu ngi khác cùng tham kho và góp ý kin. Rõ ràng cho ti nay chun mã quc t và tin b công ngh mi ang tr thành con ng duy nht a nghiên cu ting Vit vào th k th 21. Vn cn xác nh rõ các chun trong nghiên cu Hán Nôm và CNTT là gì. Trc mt ó là vn chun v mã hoá, ng mi ch vi mt con s máy có th x lí c, và con s c nht cho ch Nôm này phi c thng nht trên toàn th gii. Tip ó s là mt s chun cách vit, chun cách t tng ng gia hình ch Nôm và âm c. Cng có th nhn din mt s qui tc phán oán, mt s hoàn cnh, tình hung thit lp mi tng quan gia hình ch Nôm và âm c. T xa ti nay, và ngay c trong Hi ngh này, vic không thng nht trong oán nh các âm c cho mt s ch Nôm ã b thay i ã tng là tài cho nhiu tranh lun, tho lun. Ví d ch "lí" có khong 18 cách vit, cách vit nào xut hin lúc nào, vn bn nào, và phng ng nào còn là vn m, v.v.

[U+0674e], [U+091cc], [U+054e9], [U+088e1], [U+088cf], [U+04fda], [U+07406], [U+092f0], [U+09502], [U+09bc9], [U+09ca4], [U+09c7a], [U+09ca1], [U+09090], [U+09026], [U+05c65], [U+08372], [U+05a0c],...

Thi i Mi S 5 Tháng 7/2005

7

Nh th vn cha , mi ch trên li có nhiu cách c khác nhau... lí [U+091cc] còn c là lìa, lí [U+054e9] còn c là ré, rí, lí [U+07406] còn c là l, lí [U+05c65] còn c là giày... Cách nhìn c coi ây là nhc im ca ch Nôm. Cách nhìn mi ghi nhn rng ch vit ghi li ting nói trong lch s, ví d ting Anh ghi li cách phát âm c trc khi các nguyên âm thay v trí nhau, gi là chuyn di nguyên âm the great vowel shift. ây chính là nhng chng c chúng ta nhìn vào lch s phát trin ca ngôn ng ting Vit. Mt nhu cu ln hin nay là cn xác nh phng pháp lun nghiên cu mi i vi các vn liên quan ti ch Nôm. Phng pháp lun nghiên cu này da trên vic s dng tin b CNTT giúp cho nghiên cu v chính bn thân ch Nôm, các vn bn c và s phát trin ca ting Vit qua các vn t. Vi kh nng ca máy tính có th tích tr vào trong nó rt nhiu t liu, gn nh có th vét cn c kho t liu sách v thông thng, ngi nghiên cu gi ây có th có con mt bao quát, xuyên sut nhiu t liu rút ra các c trng ca ngôn ng, ca cách vit. CNTT hin nay có th làm c nhu cu này. Nu nh các hc gi trc ây thng phi t mình lu tr các kho t liu riêng son sách, vit bài, thì ngày nay, vi phng pháp làm vic mi, máy tính có th h tr trong vic qun lí kho t liu chung này. Do ó các phng pháp lun lu gi và trích rút thông tin tng quát t kho t liu s thc hoá trên máy tính s tr thành cc kì có ích cho gii nghiên cu. Nói riêng, vi nhng ngi ít có kh nng truy nhp trc tip vào các kho t liu này, có th cn ti mt i ng các k thut viên giúp cho h truy nhp và ly ra thông tin cn thit. Da trên công ngh hin i, cn xác nh ra các qui trình nghiên cu và làm vic mi có liên quan ti ch Nôm và CNTT to ra n np và thói quen nghiên cu mi. Các nghiên cu này thng bao gi cng phi bt u bng vic tng hp mi thông tin có c trong kho theo các ch nghiên cu, ri t ó ngi nghiên cu rút ra các nhn nh, các ý kin riêng ca mình. Nhng thông tin mi v ch Nôm, nhng phát kin mi v vic thit lp tng ng gia hình ch và âm c cn c a vào máy tính lu gi theo nhng qui trình thng nht có th phc v c cho nhiu ngi khác cùng tham kho và nghiên cu. Do ó, vic xây dng các chun v t liu, v biu din vn bn ch Nôm tr thành quan trng và cn thit. Chúng ta có th nói: · Chun mã ch Hán-Nôm giúp cho vic trao i các thông tin có tin cy tuyt i. Ví d, hình ch có mã U+091cc s không thay i khi gi qua mng hay th in t bt c ni nào trên th gii, nh tuân th theo chun quc t; Kho c s d liu cho phép chúng ta rút nhng thông tin khác ca mã U+091cc, mã có hình ch cho ta cách c "lí" ting Hán-Vit, "lìa" trong ch Nôm, và nhng thông tin khác, nh U+091cc thuôc b nào, có bao nhiêu nét, trong ng cnh nào, là danh hay ng, xut hin các câu nh th nào trong các vn bn, cách c ra sao trong các vn bn y, th k nào, v.v. Ch này có cách c nào khác trong các th ting nh Trung Quc, Hàn quc, Nht, v.v.

·

Thi i Mi S 5 Tháng 7/2005

8

3.2.2 Gii quyt vn t liu ch Nôm qua h thng lu tr tài liu ch Nôm Nhà ngôn ng hc Firth nói: Know a word by the company it keeps--ta bit ngha ca ch bng các ch khác nó gi làm bn ng hành. Vn t liu và vn bn hc i vi ch Nôm t xa ti nay ã là vn khó gii quyt vì chúng ta phi chp nhn mt quá kh không có khái nim bn quyn, mt quá kh mà mi tác phm kinh in u có s tham gia nhun sc ca nhiu ngi, k c ca chính ngi t chc vic in khc. Gii quyt trit vn t liu và vn bn hc ch có th c thc hin nu chúng ta có công c lu gi tt c các d bn và có công c trích rút ra nhng thông tin t mi d bn ó. Các nghiên cu s c chính xác hn khi mà mi ý kin và suy lun c xem xét mt cách tng th trên mi d bn ch không b ph thuc vào mi mt bn. Vic xây dng kho d liu in t v tt c các t liu hin có, t tn gc, và hình thành kho t liu nghiên cu chung cho gii Nôm hc thc s là mt nhu cu cp thit và hu ích. ây s là nn tng gii Nôm hc i ti nhng nhn nh thng nht, toàn din v các vn tranh cãi, không b buc phi da vào nhng nhn nh bt ngun t mt s t liu riêng l. Kho d liu in t này s có hai tng: tng ch và tng tác phm. Kho d liu ch Nôm s cha tt c các dng ch Nôm ã xut hin trong bt kì tài liu nào, và ngoài nhng thông tin ni ti ca nó, còn có các thông tin liên quan ti s xut hin ca chúng trong mi tài liu khác. Kho d liu các tác phm ch Nôm lu gi tt c các tác phm ch Nôm hin có (theo thi gian iu này có th làm c) di dng in t. Nó cho phép ngi nghiên cu có th trích on, rút ra các câu ch cn thit minh ho cho nghiên cu ca mình. tin kp trình th gii, rõ ràng và c th nht là tin n vic s dng ch Nôm trong Google, mt công c tra cu a ng toàn th gii. Ví d, Th vin X mt nc Y a quyn Truyn Kiu lên mng Th vin X. Ti Vit Nam, khi tra thun tuý bng quc ng, không cn quan tâm n ngha, s kt hp ng pháp và ng ngha ca các ch, nh cách tra ca mng Google, ta có th hình dung nh sau: trm nm trong cõi ngi ta (3) (6)

(16) (3) (3)

(10)

Theo phng pháp thun toán, phi ngôn ng hc, ta nhân 3 ch "trm", cho 6 ch "nm", 16 ch "trong", 3 ch "cõi", 3 ch "ngi" và 10 ch "ta", ta có 25.920 cách xp sáu ch "trm nm trong cõi ngi ta", 1 trong s 25.920 "chui sáu ch" ó là úng vn phm và ng ngha.

Thi i Mi S 5 Tháng 7/2005

9

Google vn tìm ra úng vn bn Kiu trong Th vin X, bi vì hàng ch Nôm trong vn bn Kiu là úng vn phm và ng ngha. D nhiên, nu chúng ta có mt máy phân tích ng pháp câu thì ch có 9 câu trong s 25.920 câu "trm nm trong cõi ngi ta" vi nhng ch cùng ngha khác hình (nh 3 ch "nm"

, 3 ch "trong" ) là úng ng pháp và ng ngha, rút ngn thi gian tìm ca

Google. Ví d, câu sáu "Trm nm trong cõi ngi ta..." có hình cây ng pháp sau, theo nhà ngôn ng hc Zellig Harris và nhóm lun im "chui ngôn ng" Linguistic String Project: <SENTENCE> <SA> <===== cm ph ca câu <NSTGT> <===== mang ngha thi gian <NSTG> <===== cm danh <LNR> <LN> <TPOS/> <QPOS> <===== cm lng <LQR> <LQ></LQ> <QVAR><Q> <Q></QVAR> <===== "trm" <RQ></RQ> </LQR> <APOS/> <NPOS/> </LN> <NVAR> <N> </N></NVAR> <===== danh t "nm" <RN> <PN> <===== gii t "trong" <P> </P> <NSTGO> <NSTG> <LNR> <LN></LN> <NVAR><N> <N></NVAR> <===== danh t "cõi" <RN> <NSTGO> <NSTG> <LNR> <LN></LN> <NVAR><N> </N> </NVAR> <===== "ngi ta" <RN></RN> </LNR> </NSTG>

Thi i Mi S 5 Tháng 7/2005

10

</NSTGO> </RN> </LNR> </NSTG> </NSTGO> </PN> </RN> </LNR> <NSTG> </NSTGT> </SA> <SUBJECT> ... <VERB> ... <OBJECT> ... <SA> ... </SA> </SENTENCE>

<===== mang ngha thi gian <===== câu cha ... thiu ch...

Phân tích ng pháp này cho phép chúng ta t c câu 6 "trm nm trong cõi ngi ta" mang ngha thi gian cho câu chính sp xy ra. Mun làm c iu này, các t/t in (và c s d liu) phi cho thêm thông tin, nh "trm": lng, "nm": danh, "trong": gii t, "cõi": danh, "ngi ta": danh, v.v. Thông tin ng pháp ngày nay có th rút ra t v trí ca t trong câu. Phân tích ng pháp cho phép chúng ta gn thi gian, nhân vt (ch), tên ngi, cây c, a lý, v.v. vào mt vn bn, có th rút ra thông tin y khi cn. 3.2.3 Cách tip cn toàn din ti nghiên cu v ch Nôm và ting Vit Có th coi ch Nôm nh ni chôn giu ca nhiu chng tích c ca ting Vit: nhng cách nói c, nhng cách din t ý, và tri thc cng ng ngày xa trong các tác phm c. Nhng tác phm ó ã c c nh li trong các hình ch Nôm ó, gn nh mt dng cô ng cho các quan nim, t tng, cách ngh, vn hoá ca ngi Vit. Nay vi công c x lí thông tin hin i, vi vic b công sc a tt c vn vn hoá c ca cha ông vào lu tr di dng in t, các nhà nghiên cu v sau s có kh nng v li, hình dung li các thi lch s ngày xa thông qua ngôn ng. Mt khác, vi vic ã mã hoá c hu ht các âm tit ca ting Vit qua ch Nôm, có th t vn nghiên cu ting Vit không ch di dng ch vit mà còn là di dng mã hoá cho các âm tit ting nói. Ví d, vì "lí" và là mt ch, mi ch có mt mã duy nht, mi mã là mt ting, mi ting là mt âm tit, nên mã U+091cc là mã quc t c nht cho phép ta kèm theo âm c chun, âm c Hà Ni, âm c a phng, âm c c, v.v. Mt ví d na c th hoá cách gii quyt vn bn hc ca nhng bn Kiu khác nhau bng phng pháp CNTT. Chúng ta có th ngh mt bn Kiu trên mng có cu trúc nh sau theo chun eXtensible Markup Language hay XML (mt bin th ca SGML) ca T chc Chun Quc t ISO:

Thi i Mi S 5 Tháng 7/2005

11

<sách> <ta>Truyn Kiu <thvin> ... các thông tin th vin ... </thvin> <baotang> ... các thông tin th vin ... </baotang> <songi> ... </songi> ... các thông tin khác ... </ta> <nidung> <trang s=1> <nh ngun=nhtrang1.jpg> <dòng s=1> <Nôm> <ch s=1> </ch> <ch s=2> </ch> <ch s=3> </ch> <ch s=4> </ch> <t><ch s=5> </ch> <ch s=6> </ch></t> </Nôm> <qucng> <ch s=1>trm</ch> <ch s=2>nm</ch> <ch s=3>trong</ch> <ch s=4>cõi</ch> <t><ch s=5>ngi</ch> <ch s=6>ta</ch></t> </qucng> <tingAnh> <ch s=1>hundred</ch> <ch s=2>year</ch> <ch s=3>in</ch> <ch s=4>realm, world,...</ch> <ch s=5-6>human; human being;...</ch> </tingAnh> </dòng> <dòng s=2>...vân vân ... </dòng> </trang> <trang s=2> ... vân vân ... </trang> </nidung> </sách> Loi t chc mi này có th làm t ng, khi dùng, ngi xem tu ý trình bày theo hàng dc hay hàng ngang, i chng tng ch mt, hoc tng câu, hoc tng trang, v.v. cng nh theo

Thi i Mi S 5 Tháng 7/2005

12

dõi tt c hot ng ca mt nhân vt, ví d nh M Tú bà. Hoc so sánh nhng bn khác nhau ca Kiu cùng trang, cùng dòng, cùng ch , v.v. Cách t chc mi nh trên khi áp dng vào vn bn s, chúng ta có th t vn bn s y tìm c tt c nhng gì xy ra trong môt nm nào ó ca lch s (nu quyn s có nói), hoc tt c các hot ng ca mt nhân vt, ví d nh Lê Thánh Tông, ... hoc nhng iu ã ghi v mt a im lch s nh Bch Long V, v.v.

4. M rng phm vi ng dng CNTT và ch Nôm

Vic công ngh thông tin cho phép th hin ch Nôm và các vn bn ch Nôm trên máy tính và trên mng toàn th gii ã m rng thêm các lnh vc ng dng có liên quan ti CNTT và ch Nôm. Trc ht phi k n các c s bo tn bo tàng hin ang lu gi nhiu hin vt quí báu có ghi li nhiu thông tin bng ch Hán Nôm. Nhng c s này cn trin khai các ng dng CNTT giúp cho vic lu tr và tìm kim thông tin vit bng ch Hán Nôm trên các hin vt ó. Các d án s dng CNTT trong bo qun, khai thác và ph bin di sn phi vt th ch Nôm cn c lp ra và trin khai da trên nhng thành tu mà các phn mm và CNTT cung cp. Các c s th vin có sách báo, t liu ch Nôm s cn trin khai các ng dng x lí sách báo có ch Hán Nôm, lp th mc, làm tóm tt, cung cp dng s thc ca các tác phm này. Nhiu ng dng CNTT liên quan ti th vin và ch Nôm cn c phát trin. Các công ti CNTT cn c khuyn khích và t hàng trin khai các phn mm giúp cho công tác qun lí và phc v dch v th vin vi ch Nôm. Các c s nghiên cu liên quan ti ch Nôm cn y mnh vic s dng thông tin chung v ch Nôm ã c lu tr trên máy tính. Do vic nhiu ngi nghiên cu ch Nôm có th còn cha quen thuc vi cách làm vic trên máy tính, có th cn thành lp mt s công ti dch v h tr h trong vic truy nhp vào ngun tài nguyên thông tin ch Nôm ã sn có trên máy tính. thúc y các nghiên cu CNTT v ch Nôm, nên t chc trao gii thng cho các nghiên cu ch Nôm và CNTT ca gii tr. Mt ví d, gii nhn dng ch Nôm. Các hot ng tôn giáo cng có nhu cu cn ti vic x lí ch Nôm trong các vn bn kinh sách c. Vic in li các kinh sách c ó cng là mt trong nhng nhu cu mà các nhóm v CNTT và ch Nôm có th áp ng c. Các bn kinh sách c cho phép chúng ta hình dung c các cách c ch Nôm trong các thi i, ví d, vic phiên âm các ch Phn trong các bn dch Nôm trong o Pht hoc ch La-tinh hay Âu châu trong các bn dch Nôm kinh thánh và truyn các thánh Ki-tô.

5. Thành lp nhóm kho chun Hán Nôm

Kho tàng ch Hán Nôm ca dân tc bao gm nhiu tác phm, vn, bia, kí... vn cha c phiên chuyn ht sang quc ng. Có kh nng nhiu ch Hán Nôm xut hin trong các vn bn ó vn còn cha c phát hin ra và cha c a vào kho ch Hán Nôm. Vì vy mt trong nhng nhim v cn c tip tc trong thi gian dài na là phát hin ch mi a vào kho ch Hán Nôm và tin hành các hot ng chun hoá i vi chúng a vào máy tính. Vic này

Thi i Mi S 5 Tháng 7/2005

13

cn mt nhóm chuyên gia am hiu c v Hán Nôm và CNTT thc hin. S tham gia ca mi cá nhân và tp th vào n lc này là iu rt cn thit và quan trng. ính kèm bài báo này là các mu ng kí tham gia nhóm và mu thu thp các dng ch Nôm còn cha có trong kho ch.

6. Phát trin phn mm ngun m cho ch Nôm

Vì ch Nôm là ch ca dân tc ta, cho nên nhng ngi am hiu ch Nôm nht vn s là nhng ngi Vit. Do ó vic phát trin các phn mm giúp cho khai thác và s dng ch Nôm s là mt nhu cu tt yu ca nc ta mà không có các nc khác. Cn phi có chin lc phát trin phn mm ngun m cho ch Nôm bi lí do n gin là không có các phn mm s hu riêng ca các công ti dành cho ch Nôm. Thc t ngi Vit s cn phi phát trin các phn mm c thù cho ch Nôm. Tuy th, ngay c vic chúng ta phi phát trin phn mm c thù cho ch Nôm, dùng phn mm ngun m, thì iu ó vn không có ngha là chúng ta t mình óng ca x lí ly vn ca mình. Cn phi luôn gi chin lc tích hp phn mm ch Nôm vào các phn mm quc t, tn dng nhng thành tu phát trin ca gii phn mm quc t gii quyt thêm cho các vn ca ch Nôm.

7. Mt s nhim v trc mt

Trên c s xác nh nhng tm nhìn nh vy cho ch Nôm, mt s nhim v trc mt có th cn c hoàn thành gp. 7.1. Hoàn chnh và b sung b font ch Nôm, hoàn chnh c s d liu ch Nôm Cn có nhng khuyn khích t phía nhà nc và cá nhân hoàn chnh, trao i, và b sung các b phông ch Hán-Nôm trong c nc và các ni có nhu cu nghiên cu trên th gii. Hoàn chnh c s d liu trên mng hình thành mt c s d liu ln v ch Nôm qua các thi i, theo tng phng ng, tác phm, t liu có tht trong lch s. 7.2. Nhn dng ch Nôm So vi kho ch Nôm khng l cha khai thác, ã b chin tranh hu hoi, và ang b thi gian hu hoi, trong khi các chuyên gia ch Nôm ngày càng mai mt, vic khuyn khích s dng CNTT nhn dng ch Nôm t ng là cp bách. Nhn dng ch Nôm có ngha là t mt hình ch a vào máy quét nh, các chng trình y bin các nh khung vuông thành các mã ch theo th t nguyên bn. K thut này cho n nay tuy cha hoàn ho, nhng nó rt có ích trong vic h tr các chuyên gia a vn bn y thành vn bn x lý ngôn ng hc và tri thc c. 7.3. Xây dng h thng ng kí và thu thp các ch Nôm mi Ti Hi ngh này, chúng tôi kêu gi s tham gia ca các hc gi Hán-Nôm vào Nhóm Kho Chun Hán-Nôm, mà nhim v là nhanh chóng làm kho ch Hán-Nôm chun áp ng yêu cu nghiên cu Hán-Nôm bt c ni nào trên th gii. 7.4. Ph bin chng trình bàn phím thun tin a ch Nôm vào các tài liu

Thi i Mi S 5 Tháng 7/2005

14

Vic lp trình cho bàn phím ch Hán-Nôm ng nhiên tha hng kt qu nghiên cu ca các nc s dng ch biu ý. ây, vic nghiên cu Hán-Nôm cng cn có nhng chng trình nhm thúc y k thut chúng ta theo kp các nc và s dng c li th ca ch quc ng la-tinh. 7.5. Xây dng các chng trình ging dy v s dng CNTT trong các ng dng có ch Nôm Nhng chng trình ging dy v ng dng CNTT này có tính chin lc vì mi hot ng CNTT trên th gii u tuân th chun quc t. ây, chun a ng tin xa hn mt bc vì nó òi hi mt cái nhìn toàn din và toàn cu hoá. Ví d, ngày nay lp trình CNTT, ngoài vic theo dõi chun, ngi lp trình s dng chun mang ngi s dng tham gia làm vng mnh phn mm ca mình. 7.6. Phát trin chng trình dy ch Nôm trên máy tính và mng Ging dy ch Hán-Nôm ngày nay không còn ch nm trên sách và giy mc, mc dù iu này không th thiu. Ging dy Hán-Nôm trên máy tính và mng mi lôi cun c ngi tr và làm cho vic hc Hán-Nôm có tng lai. Ý ngha kinh t ca vic hc Hán-Nôm i ôi chin lc vi vic truy cp, cài t, nghiên cu các t liu Hán-Nôm trên mng. 7.7. Xây dng h thng ng kí tác phm ch Nôm ang có Do nhng c trng lch s ca các triu i phong kin trc ây, nhng tác phm HánNôm ít tp trung, mà tn mn, giu kín trong các dòng h gia ình. Vic ng ký tác quyn các tác phm y v mt kinh t khuyn khích vic s dng các tác phm y rng rãi, tri thc trong các tác phm y nh ó làm giàu thêm cho xã hi. 7.8. Xây dng kho các vn bn c dng in t dùng chung trên mng cho cng ng Công tác này cp bách và i song song vi vic t chc thành công quy trình chun v nhn dng và bàn phím, a các vn bn c lên mng cng ng, cu nguy c s h hi vnh vin ca thi gian. Ta có th gi ây là mt chng trình quc gia a các vn bn quý giá lên mng. 7.9. Lp din àn, hi ngh, tip tc trao i và tho lun v ch Nôm c Nhng vn ch Nôm v lý thuyt và vn bn hc mãi mãi còn tn ti cho n khi chúng ta có c mt phng án t ng phân tích cú pháp ch Nôm. S trao i này nhm tin n kh nng x lý vn bn mt s lng ln. Vic t chc thng niên các hi nghi quc t v ch Nôm là mt bin pháp thúc y các nghiên cu và ng dng CNTT vào ch Nôm phc v cho công tác bo tn di sn cng nh ph cp.

8. Kt lun

Nhu cu tr v vi vn hoá dân tc là ng lc chính cho ch Nôm trng tn vi s phát trin i lên ca dân tc. Các tin b ca CNTT thc s ã m ra nhng hng h tr cho vic bo tn và ph bin ch Nôm. Nhu cu ca các c s vn hoá trong nc và quc t có tài liu liên quan ti ch Nôm là ng lc thúc y các nghiên cu hin i v ch Nôm.

Thi i Mi S 5 Tháng 7/2005

15

Vic thay i phng pháp lun làm vic vi các vn liên quan ti ch Nôm và CNTT là iu rt quan trng và cn thit m ra mt thi kì mi cho các nghiên cu v ch Nôm. Các h tng c s cho ch Nôm ã, ang và s c phát trin.

TÀI LIU THAM KHO 1. 2. 3. 4. 5. 6. 7. 8. Các tp mã ch Nôm do Vit Nam cung cp cho nhóm ISO 10646 JTC1/IRG t nm 1994 n nay: NPCT 2.1, TCVN 5712: 1993, TCVN 5773: 1993, TCVN 6056: 1995, VHN1: 1998, VHN2: 1998. ngh CJK Extension C1 ca Vit Nam ISO 10646 JTC1/IRG t nm 1994 n nay, Unihan 3.1 Radical-Stroke Index. Quc Bo, các b phông HanNom. Linh mc Trn Vn Kim. Giúp c Nôm và Hán Vit. Nhà xut bn Thun Hóa, 1999. Lê Mai Phng. Hc ch Nôm theo Tam thiên t. Trình bày ti Hi tho Hè 2002, i hc Maine. Ngô Thanh Nhàn, Ngô Trung Vit và Nhóm Nôm Na. Qui trình Nôm Na, trình bày ti Hi tho hè 2002, i hc Maine. Ngô Thanh Nhàn. n v chính t và các c im ca ting Vit: ch quc ng, h latinh, ch Nôm, h biu ý và Unicode/ISO IEC 10646, U ban Unicode/ISO 10646 Vit Nam. 2001. Ngô Trung Vit, Trân Lu Chng, Ngô Thanh Nhàn, Ð Bá Phc, Nguyn Quang Hng, Nguyn Hoàng, Lê Phm Ngng Hng, Hà Dng Tun, Ð Tuyt Khanh & H Vn Tin: Phát trin phn mm ch Nôm. Hi tho Hè 2001 ti Aix-en-Provence, Pháp, 2001. Nguyn Quang Hng, Ngô Thanh Nhàn, Ð Bá Phc and Ngô Trung Vit: Ch Nôm: Vn hoá c truyn và thông tin hiên i. Tp chí Ngôn Ng 4(1999): 11-22. Hà Ni. Vin Ngôn ng hc. Bng tra ch Nôm. Nhà xut bn Khoa hc Xã hi Hà Ni 1976. V Vn Kính & Nguyn Quang X. T in Ch Nôm. Trung tâm Hc liu. Sàigòn 1971. V Vn Kính. i t in ch Nôm. Nhà xut bn Vn Ngh Tp H Chí Minh & Trung tâm nghiên cu Quc hc Hu. 1999. Nguyn Quang Hng (ch biên). Li dn T in Ch Nôm Ting Vit. Vin nghiên cu Hán Nôm. ang in.

9. 10. 11. 12. 13.

14. Trng ình Tín. Bng Phiên âm Nôm Vit. Nhà xut bn Thun Hóa. 2003. 15. Sager, N. Natural Language Information Processing: A Computer Grammar of English and Its Applications. Addison-Wesley, Reading, MA. 1981.

Copyright © 2004 by The Institute of Hán Nôm Studies & The Vietnamese Nôm Preservation Foundation.

Information

Microsoft Word - 34 NTNhan-NTVIet-Tam nhin Nom.doc

15 pages

Report File (DMCA)

Our content is added by our users. We aim to remove reported files within 1 working day. Please use this link to notify us:

Report this file as copyright or inappropriate

258325