Read Microsoft Word - tong quan xac dinh khuon mat nguoi Pham the Bao.doc text version

Tng quan các phng pháp xác nh khuôn mt ngi

Phm Th Bo, Nguyn Thành Nht, Cao Minh Thnh, Trn Anh Tun, Phan Phúc Doãn

I. GII THIU Hn mt thp k qua có rt nhiu công trình nghiên cu v bài toán xác nh khuôn mt ngi t nh en trng, xám n nh màu nh ngày hôm nay. Các nghiên cu i t bài toán n gin, mi nh ch có mt khuôn mt ngi nhìn thng vào thit b thu hình và u t th thng ng trong nh en trng. Cho n ngày hôm nay bài toán m rng cho nh màu, có nhiu khuôn mt trong cùng mt nh, có nhiu t th thay i trong nh. Không nhng vy mà còn m rng c phm vi t môi trng xung quanh khá n gin (trong phòng thí nghim) cho n môi trng xung quanh rt phc tp (nh trong t nhiên) nhm áp ng nhu cu tht s và rt nhiu ca con ngi. 1. nh ngha bài toán xác nh khuôn mt ngi Xác nh khuôn mt ngi (Face Detection) là mt k thut máy tính xác nh các v trí và các kích thc ca các khuôn mt ngi trong các nh bt k (nh k thut s). K thut này nhn bit các c trng ca khuôn mt và b qua nhng th khác, nh: tòa nhà, cây ci, c th, ... [105]. 2. ng dng ca phng pháp xác nh khuôn mt ngi Có nhiu ng dng ã c và ang thit k, tôi ch xin a ra mt s loi ng dng sau: o H thng tng tác gia ngi và máy: giúp nhng ngi b tt hoc khim khuyt có th trao i. Nhng ngi dùng ngôn ng tay có th giao tip vi nhng ngi bình thng. Nhng ngi b bi lit thông qua mt s ký hiu nháy mt có th biu l nhng gì h mun, .... ó là các bài toán iu b ca bàn tay (hand gesture), iu b 1 o o o

o

o

o

khuôn mt, ... [5, 6, 7, 32, 54, 95, 118, 130]. Nhn dng ngi A [29, 38, 46, 55, 56, 58, 60, 61] có phi là ti phm truy nã hay không? Giúp c quan an ninh qun lý tt con ngi. Công vic nhn dng có th trong môi trng bình thng cng nh trong bóng ti (s dng camera hng ngoi). H thng quan sát, theo dõi [35, 35, 106] và bo v. Các h thng camera s xác nh âu là con ngi và theo dõi con ngi ó xem h có vi phm gì không, ví d xâm phm khu vc không c vào, .... Lu tr (rút tin ATM, bit ai rút tin vào thi im ó), hin nay có tình trng nhng ngi b ngi khác ly mt th ATM hay mt mã s PIN và nhng ngi n cp này i rút tin, hoc nhng ngi ch th i rút tin nhng li báo cho ngân hàng là mt th và mt tin. Các ngân hàng có nhu cu khi có giao dch tin s kim tra hay lu tr khuôn mt ngi rút tin sau ó i chng và x lý [66, 81, 98, 133]. Th cn cc, chng minh nhân dân (Face Identification) [114]. iu khin vào ra: vn phòng, công ty, tr s, máy tính, Palm, .... Kt hp thêm vân tay và mng mt. Cho phép nhân viên c ra vào ni cn thit, hay mi ngi s ng nhp máy tính cá nhân ca mình mà không cn nh tên ng nhp cng nh mt khu mà ch cn xác nh thông qua khuôn mt [44]. An ninh sân bay, xut nhp cnh (hin nay c quan xut nhp cnh M ã áp dng).

o

o

o

o o

o

o o o

Dùng xác thc ngi xut nhp cnh và kim tra có phi là nhân vt khng b không. Tng lai s phát trin các loi th thông minh có tích hp sn c trng ca ngi dùng trên ó, khi bt c ngi dùng khác dùng truy cp hay x lý ti các h thng s c yêu cu kim tra các c trng khuôn mt so vi th bit nay có phi là ch th hay không. Tìm kim và t chc d liu liên quan n con ngi thông qua khuôn mt ngi trên nhiu h c s d liu lu tr tht ln, nh internet, các hãng truyn hình, .... Ví d: tìm các on video có tng thng Bush phát biu, tìm các phim có din viên Lý Liên Kit óng, tìm các trn á banh có Ronaldo á, ... [50, 94, 134]. Hin nay có nhiu hng tip cn xác nh mt nh có phi là nh kha thân hay không? Khuôn mt ngi c xem nh mt yu t xác nh cho mt hng tip cn mà c dùng gn ây [271, 272]. ng dng trong video phone [10]. Phân loi trong lu tr hình nh trong in thoi di ng. Thông qua bài toán xác nh khuôn mt ngi và trích c trng, ri da vào c trng này sp xp lu tr, giúp ngi s dng d dàng truy tìm khi cn thit [69, 105]. Kim tra trng thái ngi lái xe có ng gt, mt tp trung hay không, và h tr thông báo khi cn thit [109]. Phân tích cm xúc trên khuôn mt [112]. Trong lãnh vc thit k iu khin robot [42, 43, 124, 151, 236]. Hãng máy chp hình Canon ã ng dng bài toán xác nh khuôn mt ngi vào máy chp hình th h mi cho kt qu hình nh p hn, nht là khuôn mt ngi [277].

II. PHNG PHÁP XÁC NH KHUÔN MT NGI Có nhiu nghiên cu tìm phng pháp xác nh khuôn mt ngi, t nh xám n ngày nay là nh màu. Tôi s trình bày mt cách tng quát nht nhng hng gii quyt chính cho bài toán, t nhng hng chính này nhiu tác gi thay i mt s ý nh bên trong có kt qu mi. Da vào tính cht ca các phng pháp xác nh khuôn mt ngi trên nh. Các phng pháp này c chia làm bn [9] hng tip cn chính. Ngoài bn hng này, nhiu nghiên cu có khi liên quan n không nhng mt hng tip cn mà có liên quan nhiu hn mt hng chính: o Hng tip cn da trên tri thc: Mã hóa các hiu bit ca con ngi v các loi khuôn mt ngi thành các lut. Thông thng các lut mô t quan h ca các c trng. o Hng tip cn da trên c trng không thay i: Mc tiêu các thut toán i tìm các c trng mô t cu trúc khuôn mt ngi mà các c trng này s không thay i khi t th khuôn mt, v trí t thit b thu hình hoc iu kin ánh sáng thay i. o Hng tip cn da trên so khp mu: Dùng các mu chun ca khuôn mt ngi (các mu này c chn la và lu tr) mô t cho khuôn mt ngi hay các c trng khuôn mt (các mu này phi chn làm sao cho tách bit nhau theo tiêu chun mà các tác gi nh ra so sánh). Các mi tng quan gia d liu nh a vào và các mu dùng xác nh khuôn mt ngi. o Hng tip cn da trên din mo: Trái ngc hn vi so khp mu, các mô hình (hay các mu) c hc t mt tp nh hun luyn trc ó. Sau ó h thng (mô hình) s xác nh khuôn mt ngi. Hay mt s tác gi còn gi hng tip cn này là hng tip cn theo phng pháp hc. 1. Hng tip cn da trên tri thc Trong hng tip cn này, các lut s ph thuc rt ln vào tri thc ca nhng tác gi nghiên cu v bài toán xác nh khuôn mt ngi. ây là hng tip cn dng top-down. D dàng xây dng các lut c bn mô t các c trng ca khuôn mt và các quan h tng ng. Ví d, mt khuôn mt thng có hai mt i xng nhau qua trc thng ng gia khuôn mt và có mt mi, mt ming. Các quan h

2

ca các c trng có th c mô t nh quan h v khong cách và v trí. Thông thng các tác gi s trích c trng ca khuôn mt trc tiên có c các ng viên, sau ó các ng viên này s c xác nh thông qua các lut bit ng viên nào là khuôn mt và ng viên nào không phi khuôn mt. Thng áp dng quá trình xác nh gim s lng xác nh sai. Mt vn khá phc tp khi dùng hng tip cn này là làm sao chuyn t tri thc con ngi sang các lut mt các hiu qu. Nu các lut này quá chi tit (cht ch) thì khi xác nh có th xác nh thiu các khuôn mt có trong nh, vì nhng khuôn mt này không th tha mãn tt c các lut a ra. Nhng các lut tng quát quá thì có th chúng ta s xác nh lm mt vùng nào ó không phi là khuôn mt mà li xác nh là khuôn mt. Và cng khó khn m rng yêu cu t bài toán xác nh các khuôn mt có nhiu t th khác nhau.

bn", và "mc khác nhau gia các giá tr xám trung bình ca phn trung tâm và phn bao bên trên là áng k". phân gii thp nht (mc m) ca nh dùng tìm ng viên khuôn mt mà còn tìm các mc phân gii tt hn. mc hai, xem xét biu histogram ca các ng viên loi bt ng viên nào không phi là khuôn mt, ng thi dò ra cnh bao xung quanh ng viên. mc cui cùng, nhng ng viên nào còn li s c xem xét các c trng ca khuôn mt v mt và ming. Hai ông ã dùng mt chin lc "t thô n mn" hay "làm rõ dn" gim s lng tính toán trong x lý. Mc dù t l chính xác cha cao, nhng ây là tin cho nhiu nghiên cu sau này [200]. Kotropoulos và Pitas [200] a mt phng pháp tng t [191, 261] dùng trên phân gii thp. Hai ông dùng phng pháp chiu xác nh các c trng khuôn mt, Kanade ã thành công vi phng pháp chiu xác nh biên ca khuôn mt [191]. Vi I(x,y) là giá tr xám ca mt im trong nh có kích thc m x n ti v trí (x,y), các hàm chiu nh theo phng ngang và thng ng c nh ngha nh sau: HI ( x) =

m

Hình 1: (a) nh ban u có phân gii n=1; (b), (c), và (d) nh có phân gii n=4, 8, và 16.

n y=1

I ( x, y) và

V I ( y) = x=1 I ( x, y) . Da trên biu hình chiu

ngang, có hai cc tiu a phng khi hai ông xét quá trình thay i c ca HI, ó chính là cnh bên trái và phi ca hai bên u. Tng t vi hình chiu dc VI, các cc tiu a phng cng cho ta bit v trí ming, nh mi, và hai mt. Các c trng này xác nh khuôn mt. Hình 3.a cho mt ví d v cách xác nh nh trên. Cách xác nh này có t l xác nh chính xác là 86.5% cho trng hp ch có mt khuôn mt thng trong nh và hình nn không phc tp. Nu hình nn phc tp thì rt khó tìm, hình 3.b. Nu nh có nhiu khuôn mt thì s không xác nh c, hình 3.c.

Hình 2: Mt lai tri trc ca ngi nghiên cu phân tích trên khuôn mt.

Yang và Huang [261] dùng mt phng thc theo hng tip cn này xác các khuôn mt. H thng ca hai tác gi này bao gm ba mc lut. mc cao nht, dùng mt khung ca s quét trên nh và thông qua mt tp lut tìm các ng viên có th là khuôn mt. mc k tip, hai ông dùng mt tp lut mô t tng quát hình dáng khuôn mt. Còn mc cui cùng li dùng mt tp lut khác xem xét mc chi tit các c trng khuôn mt. Mt h thng a phân gii có th t c dùng xác nh, hình 1. Các lut mc cao nht tìm ng viên nh: "vùng trung tâm khuôn mt (phn ti hn trong hình 2) có bn phn vi mt mc u c bn", "phn xung quanh bên trên ca mt khuôn mt (phn sáng hn trong hình 2) có mt mc u c 3

Hình 3: Phng pháp chiu: (a) nh ch có mt khuôn mt và hình nn n gin; (b) nh ch có mt khuôn mt và hình nn phc tp; (c) nh có nhiu khuôn mt

Hình 4: Chiu tng phn ng viên xác nh khuôn mt.

Fan [82] phân on nh màu tìm cnh thông qua thut toán tng vùng xác nh các ng viên. Dùng c tính hình ellipse ca khuôn mt ngi xác nh ng viên nào khuôn mt ngi. Kim [65] kt hp thut toán watershed cho các nh có nhiu phângii cùng mô hình màu da ngi tìm ng viên, ri xác nh khuôn mt ngi trong video. T l chính xác khong 87-94%. Phng pháp ch x lý cho các frame nh ch có mt khuôn mt và nh này phi chp thng ch có u và vai. Sahbi và Boujemaa [8] s dng mng neural hc c lng các tham s cho mô hình Gauss, mc ích tìm ng viên trên sc màu da ca ngi. Sau khi có ng viên, hai ông chiu lên hai trc: ng và ngang xác nh khuôn mt ngi. Có nhiu nghiên cu sau này s dng phng pháp chiu xác nh khuôn mt ngi. Min [80] dùng mô hình màu da không tham s, Baskan [76], Mateos [74], và Nicponski [45] xây dng b lc, tìm ng viên khuôn mt, sau ó chiu lên hai trc xác nh các thành phn khuôn mt xác nh ng viên ó có phi là khuôn mt hay không. Còn Mateos và Chicote [34] dùng kt cu xác nh ng viên trong nh màu. Sau ó phân tích hình dáng, kích thc, thành phn khuôn mt xác nh khuôn mt. Khi tìm c ng viên khuôn mt, hai ông trích các ng viên ca tng thành phn khuôn mt, sau ó chiu tng phn này xác thc ó có phi là thành phn khuôn mt hay không, hình 4. T l chính xác hn 87%. Farhad và Abdolhorsein [136] dùng tri thc v histogram xác nh khuôn mt trong các frame liên tc trong mt on video. Tng t, Hidekazu và Mamoru [100, 139] cng dùng histogram, nhng hai ông dùng thut gii di truyn (Genetic Algorithm ­ GA) lai nh là mt phng pháp tìm kim ngu nhiên da vào nh ca biu màu ca nh.

Rodrigues và Buf [132] dùng phng pháp chn các keypoint trong nhiu t l khác nhau, c bit tác gi ch dùng các keypoint d tha da trên nhiu phân gii. Da trên quan h hình hc ca các thành phn khuôn mt, hai ông nhóm các keypoint li xác nh khuôn mt ngi. Fred [1140] d trên tính cht i xng ca khuôn mt ngi, ông xem xét các phân b trên histogram có tính cht gn i xng xác nh khuôn mt ngi trong nh xám n có khuôn mt chp thng. Berbar [279] kt hp mô hình màu da ngi và xác nh cnh tìm ng viên khuôn mt ngi. Sau ó kt hp quan h các c trng và phng pháp chiu các ng viên khuôn mt xung hai trc: dng và ngang xác nh ng viên nào tht s là khuôn mt ngi. 2. Hng tip cn da trên c trng không thay i ây là hng tip cn theo kiu bottom-up. Các tác gi c gng tìm các c trng không thay i ca khuôn mt ngi xác nh khuôn mt ngi. Da trên nhn xét thc t, con ngi d dàng nhn bit các khuôn mt và các i tng trong các t th khác nhau và iu kin ánh sáng khác nhau, thì phi tn ti các thuc tính hay c trng không thay i. Có nhiu nghiên cu u tiên xác nh các c trng khuôn mt ri ch ra có khuôn mt trong nh hay không. Các c trng nh: lông mày, mt, mi, ming, và ng vin ca tóc c trích bng phng pháp xác nh cnh. Trên c s các c trng này, xây dng mt mô hình thng kê mô t quan h ca các c trng này và xác nh s tn ti ca khuôn mt trong nh. Mt vn ca các thut tóan theo hng tip cân c trng cn phi iu chnh cho phù hp iu kin ánh sáng, nhiu, và b che khut. ôi khi bóng ca khuôn mt s to thêm cnh mi, mà cnh này li rõ hn cnh tht s ca khuôn mt, vì th nu dùng cnh xác nh s gp khó khn. a) Các c trng khuôn mt Sirohey a mt phng pháp xác nh khuôn mt t mt nh có hình nn phc tp [240]. Phng pháp da trên cnh (dùng phng pháp Candy [155] và heuristics loi b các cnh còn li duy nht 4

mt ng bao xung quanh khuôn mt. Mt hình ellipse dùng bao khuôn mt, tách bit vùng u và hình nn. T l chính xác ca thut tóan là 80%. Cng dùng phng pháp cnh nh Sirohey, Chetverikov và Lerch dùng mt phong pháp da trên blob và streak (hình dng git nc và sc xen k), xác nh theo hng các cnh [157]. Hai ông dùng hai blob ti và ba blob sáng mô t hai mt, hai bên gò má, và mi. Mô hình này dùng các treak mô t hình dáng ngoài ca khuôn mt, lông mày, và môi. Dùng nh có phân gii thp theo bin i Laplace xác nh khuôn mt thông qua blob. Graf a ra mt phng pháp xác nh c trng ri xác nh khuôn mt trong nh xám [180]. Dùng b lc làm ni các biên, các phép tóan hình thái hc (morphology) c dùng làm ni bt các vùng có cng cao và hình dáng chc chn (nh mt). Thông qua histogram tìm các nh ni bt xác nh các ngng chuyn nh xám thành hai nh nh phân. Các thành phn dính nhau u xut hin trong hai nh nh phân thì c xem là vùng ca ng viên khuôn mt ri phân loi xem có phi là khuôn mt không. Phng pháp c kim tra trên các nh ch có u và vai ca ngi. Tuy nhiên còn vn , làm sao s dng các phép toán morphology và làm sao xác nh khuôn mt trên các vùng ng viên. Leung trình bày mt mô hình xác sut xác nh khuôn mt trong nh có hình nn phc tp trên c s mt b xác nh c trng cc b và so khp th ngu nhiên [205]. Ý chính là xem bài toán xác nh khuôn mt nh là bài toán tìm kim vi mc tiêu là tìm th t các c trng chc chn ca khuôn mt to thành ging nht mt mu khuôn mt. Dùng nm c trng (hai mt, hai l mi, phn ni gia mi và ming) mô t mt khuôn mt. Luôn tính quan h khong cách vi các c trng cp (nh mt trái, mt phi), dùng phân b Gauss mô hình hóa. Mt mu khuôn mt c a ra thông qua trung bình tng ng cho mt tp a hng, a t l ca b lc o hàm Gauss. T mt nh, các c trng ng viên c xác nh bng cách so khp tng im nh khi lc tng ng vi vector mu (tng t mi tng quan), chn hai ng viên c trng ng u tìm kim cho các c

trng khác ca khuôn mt. Ging nh xây dng mt th quan h mi node ca th tng ng nh các c trng ca mt khuôn mt, a xác sut vào xác nh. T l xác nh chính xác là 86%. Bên cnh tính khang cách liên quan mô t quan h gia các c trng nh Leung [154, 206]. Kendall [195] và [212] dùng lý thuyt xác sut thng kê v hình dáng. Dùng hàm mt xác sut (Probility Density Function - PDF) qua N im c trng, tng ng (xi, yi) là c trng th i vi gi s da vào phân b Gauss có 2N-chiu. Các tác gi áp dng phng thc cc i kh nng (MaximumLikelihood - ML) xác nh v trí khuôn mt. Mt thun li ca phng pháp này là các khuôn mt b che khut vn có th xác nh c. Nhng phng pháp không xác nh c a khuôn mt trong nh. Yow và Cipolla [265, 266] trình bày mt phng thc da vào c trng, dùng s lng ln các du hiu t nh và c du hiu v ng cnh. u tiên dùng b lc o hàm Gauss th hai, xác nh các im mu cht ti cc i a phng trong b lc, ri ch ra ni có th là c trng. Giai on hai, kim tra các cnh xung quanh im mu cht và nhóm chúng li thành các vùng. Tiêu chun nhóm các cnh là gn và tng t hng và cng . o lng các c tính vùng nh: chiu dài cnh, cng cnh, và bin thiên cng c lu trong mt vector c trng. T d liu c trng khuôn mt ã c hun luyn, s tính c giá tr trung bình và ma trn hip phng sai ca mi c trng khuôn mt. Mt vùng là ng viên khuôn mt khi khong cách Mahalanobis gia các vector c trng u di mt ngng. Ri thông qua mng Bayes xác nh ng viên có phi là khuôn mt không. T l chính xác là 85% [267], tuy nhiên mc sai là 28%, và ch hiu qu vi hình khuôn mt có kích thc 60x60 im nh. Phng pháp này c dùng thêm vi mô hình ng vin linh hat [158, 267]. Takacs và Wechsler trình bày mt phng pháp da trên tích c trng võng mc và c ng theo dao ng nh ca mt [250]. Thut toán hot ng trên bn hay vùng ca các mu cht, mô hình hóa li võng mc. u tiên tính toán c lng thô vùng khuôn mt trên c s b lc. Giai on th hai

5

tinh ch trên phân gii mn hn. T l sai là 4.69%. Han phát trin mt k thut trên c s morphology trích các on ging mt (eyeanalogue) xác nh khuôn mt ngi [182]. Ông nói rng mt và lông mày là c trng ni bt nht và n nh nht ca khuôn mt con ngi, và nó rt hu dng xác nh khuôn mt ngi. Ông nh ngha các on ging mt nh là các cnh trên ng vin ca mt. u tiên, các phép tóan morphology nh óng, ct b sai khác, và phân ngng trích các im nh có giá tr cng thay i áng k. Các im nh này s tr thành các im nh ging mt. Sau ó mt tin trình gán nhãn sinh các on ging mt. Các on này c dùng ch dn tìm kim các vùng tim nng có th là khuôn mt qua kt hp các c tính hình hc ca mt, mi, lông mày, và ming. Các vùng này s c mt mng neural xem xét có phi là khuôn mt không, ging [48]. Theo tác gi t l chính xác là 94%. Amit a ra phng thc xác nh khuôn mt da trên hình dáng và áp dng cho các khuôn mt chp thng [145]. Có hai giai on xác nh khuôn mt ngi: tp trung và phân loi chi tit. Làm có th t các mnh cnh, các mnh này c trích t b xác nh cnh n gin thông qua s khác bit cng là quá trình tp trung. Khi có các ng viên t quá trình trên, dùng thut toán CART [152] xây dng mt cây phân loi t các nh hun luyn, xem xét ng viên nào là khuôn mt ngi. Jin [90] dùng cu trúc hình hc ca khuôn mt ngi tìm ng viên khuôn mt trong nh xám và hình nn không phc tp. Mi nh ch có mt khuôn mt ngi, nhng t th iu kin ánh sáng, không c nh. T l chính xác khang 94.25% và thi gian khá nhanh. Chan và Lewis [16] dùng k thut lc loi bt tác ng ca ánh sáng, sau ó phân on tìm v trí các ng viên là con mt. T các ng viên này xây dng mng neural nh Rowley [48] xác nh khuôn mt ngi. Phng pháp này có th xác nh nhiu khuôn mt trong mt nh, các khuôn mt này

có th có các t th, v trí, t l khác nhau. T l chính xác là 53%. Kruppa [21] dùng sc màu ca da ngi tìm ng viên, nhng ông không x lý cho tng im nh theo cách thông thng, mà ông dùng mô hình màu da ngi trên tng phn nh ri x lý phân on trên ó. Sau khi có ng viên khuôn mt, ông dùng mt s c tính v hình dáng xác nh khuôn mt ngi. T l chính xác là 85%. Park dùng Gaze tìm ng viên góc mt, ming và tâm mt [27]. Ông xây dng SVM ã c hc trc ó xác nh các v trí ng viên có phi là góc mt, ming, và tâm mt hay không theo vt con mt ngi. Sato [67] dùng quan h ng vin cm ca khuôn mt. Tác gi chia làm hai trng hp: thon dài và tròn xem xét. Tác gi dùng GA xem xét mi tng quan ca ng cong, hình dáng khuôn mt xác nh khuôn mt. Chai và Ngan [708] xây dng phng pháp xác nh khuôn mt ngi da trên c trng v: quan h hình hc, mt , chói trong nh màu ch có u và vai ca ng viên xác nh. Kim [47] cng phân on tìm ng viên khuôn mt, nhng xác thc khuôn mt thông qua các cu trúc các c trng mt, mi, ming, và ng vin ca ng viên. Jang [53] dùng phân b màu da phân on tìm ng viên ri dùng các c trng hình hc xác nh khuôn mt. Christian và Jonh [135] xây dng mt loi c trng mi, ó là c trng v cong ca các ng trên khuôn mt gii quyt vn iu kin ánh sáng. T c trng cong này, hai ông quay li phng pháp PCA xác nh khuôn mt. Juan và Narciso [111] xây dng mt không gian màu mi YCg'Cr' lc các vùng là ng viên khuôn mt da trên sc thái ca màu da ngi. Sau khi có ng viên, hai ông dùng các quan h v hình dáng khuôn mt, mc cân i ca các thành phn khuôn mt xác nh khuôn mt ngi. Tng t, Chang và Hwang [127] cng dùng mt phng thc nh [111], t l chính xác hn 80% trong nh xám. Dae và Nam [116] xem xét các c trng không thay i khi thay i t th ca khuôn mt bng cách xem xét các quan h hình hc. Sau ó c

6

lng các t th ca khuôn mt ri xây dng d liu xác nh thông qua PCA. T l chính xác là 76%. Jin [128] xây dng mt b lc xác nh ng viên khuôn mt ngi theo màu da ngi. T ng viên này tác gi xác nh khuôn mt ngi theo hình dáng khuôn mt và các quan h c trng v thành phn khuôn mt, vi mt phi c chn làm gc ta xét quan h. T l chính xác cho khuôn mt chp thng trên 80%. b) Kt cu Khuôn mt con ngi có nhng kt cu riêng bit mà có th dùng phân loi so vi các i tng khác. Augusteijn và Skufca cho rng hình dng ca khuôn mt dùng làm kt cu phân loi [147], gi là kt cu ging khuôn mt (face-like texture). Tính kt cu qua các c trng thng kê th t th hai (SGLD) [183] trên vùng có kích thc 16x16 im nh. Có ba loi c trng c xem xét: màu da, tóc, và nhng th khác. Hai ông dùng mng neural v mi tng quan cascade [170] cho phân loi có giám sát các kt cu và mt ánh x c trng t t chc Kohonen [199] gom nhóm các lp kt cu khác nhau. Hai tác gi xut dùng phng pháp bu c khi không quyt nh c kt cu a vào là kt cu ca da hay kt cu ca tóc. Dai và Nakano dùng mô hình SGLD xác nh khuôn mt ngi [165]. Thông tin màu sc c kt hp vi mô hình kt cu khuôn mt. Hai tác gi xây dng thut gii xác nh khuôn mt trong không gian màu, vi các phn ta màu cam xác nh các vùng có th là khuôn mt ngi. Mt thun li ca phng pháp này là có th xác nh khuôn mt không ch chp thng và có th có râu và có kính. Mark và Andrew [12] dùng phân b màu da và thut toán DoG (a Difference of Gauss) tìm các ng viên, ri xác thc bng mt h thng hc kt cu ca khuôn mt. Manian và Ross [88] dùng bin i wavelet xây dng tp d liu kt cu ca khuôn mt trong nh xám thông qua nhiu phân gii khác nhau kt hp xác sut thông kê xác nh khuôn mt ngi. Mi mu s có chín c trng. T l chính xác là 87%, t l xác nh sai là 18%.

c) Sc màu ca da Thông thng các nh màu không xác nh trc tip trên toàn b d liu nh mà các tác gi dùng tính cht sc màu ca da ngi (khuôn mt ngi) chn ra c các ng viên có th là khuôn mt ngi (lúc này d liu ã thu hp áng k) xác nh khuôn mt ngi. Tôi s trình bày chi tit v mô hình hóa màu da ngi mt bài sau. d) a c trng Gn ây có nhiu nghiên cu s dng các c trng toàn cc nh: màu da ngi, kích thc, và hình dáng tìm các ng viên khuôn mt, ri sau ó s xác nh ng viên nào là khuôn mt thông qua dùng các c trng cc b (chi tit) nh: mt, lông mày, mi, ming, và tóc. Tùy mi tác gi s s dng tp c trng khác nhau [70, 186]. Yachida a ra mt phng pháp xác nh khuôn mt ngi trong nh màu bng lý thuyt logic m [156, 259, 260]. Ông dùng hai mô hình m mô t phân b màu da ngi và màu tóc trong không gian màu CIE XYZ. Nm mô hình hình dng ca u (mt thng và bn xoay xung quanh) mô t hình dáng ca mt trong nh. Mi mô hình hình dng là mt mu 2-chiu bao gm các ô vuông có kích thc mxn, mi ô có th cha nhiu hn mt im nh. Hai thuc tính c gán cho mi ô là: t l màu da và t l tóc, ch ra t l din tích vùng da (tóc) trong ô so vi din tích ca ô. Mi im nh s c phân loi thành tóc, khuôn mt, tóc/khuôn mt, và tóc/nn trên c s phân b ca mô hình, theo cách ó s có c các vùng ging khuôn mt và ging tóc. Mô hình hình dáng ca u s c so sánh vi vùng ging khuôn mt và ging tóc. Nu tng t, vùng ang xét s tr thành ng viên khuôn mt, sau ó dùng các c trng mt-lông mày và mi-ming xác nh ng viên nào s là khuôn mt tht s. Sobottka và Pitas dùng các c trng v hình dáng và màu sc xác nh khuôn mt ngi [241]. Dùng mt ngng phân on trong không gian màu HSV xác nh các vùng có th là màu da ngi (vùng ging màu da ngi) [251, 252], các tin ng viên. Các thành phn dính nhau s c xác nh bng thut toán tng vùng phân gii thô. Xem xét tin ng viên nào va khp hình dng

7

ellipse s c chn làm ng viên ca khuôn mt. Sau ó dùng các c trng bên trong nh: mt và ming, c trích ra trên c s các vùng mt và ming s ti hn các vùng khác ca khuôn mt, sau cùng phân loi da trên mng neural bit vùng ng viên nào là khuôn mt ngi và vùng nào không phi khuôn mt ngi. T l chính xác là 85%. Da vào mc cân xng ca các mu khuôn mt ngi xác nh khuôn mt ngi [154]. Mt b phân loi màu da/không phi màu da dùng trong không gian màu YES cho phép làm mn các vùng k có ng cong không mn, sau khi lc các vùng có th là màu da ngi. Mt mu khuôn mt dng ellipse c dùng xem xét mc tng t ca các vùng có cùng màu da ngi vi mu này thông qua khong cách Hausdorff [188]. Sau cùng, xác nh tâm mt thông qua các hàm tính giá tr da trên quan h cân i ca khuôn mt và v trí hai mt. nh ca mi và tâm ca ming c c lng qua khong cách tâm mt. Mt hn ch ca phng pháp này là ch xác nh trên nh chp thng khuôn mt, ch có duy nht mt khuôn mt trong nh, và xác nh c v trí ca c hai mt. Cng có tác gi dùng phng pháp tng t gii quyt [245]. Trái ngc vi phng pháp x lý trên im nh, mt phng pháp c xây dng trên cu trúc, màu sc, và liên quan hình hc ã c ngh [262]. u tiên dùng phân on a t l [144] trích các vùng ng u trong nh da vào mô hình màu da ngi theo Gauss có c các vùng có màu cùng vi màu da ngi, gom các vùng này vào trong các vùng có hình dng ellipse. Mt vùng có hình dng ellipse c xác nh là mt khuôn mt ngi nu tn ti mt ming trong vùng ó. Tác gi cho bit có th xác nh các khuôn mt các hng khác nhau khi có thêm các c trng ph nh: râu, mt kính. Kauth trình bày mt biu din dng blob trích c trng, mà c trng này dùng tô t có ý ngha cu trúc ca a ph ca nh chp t v tinh [194]. Mi vector c trng ti mt im nh bao gm các ta ca im nh và liên quan theo các thành phn ph (hay các thành phn kt cu). Các im nh này c gom nhóm bng cách dùng vector c trng có các vùng dính lin nhau, hoc có dng

blob. Mi vector c trng bao gm ta nh và sc màu c chun hóa,

X = ( x, y,

r g , ) [218, 243]. Dùng r + g+ b r + g+ b

mt thut toán to các vùng liên kt li vi nhau tng kích thc ca blob và xem xét nu ng viên dng blob nào tha mãn hình dáng kích thc khuôn mt thì xem ó là khuôn mt. Phm vi và màu sc c Kim [197] dùng xác nh khuôn mt ngi. Tính biu chênh lch ri phân on da trên biu histogram vi gi thuyt các im nh là nn s có cùng sâu và s lng s nhiu hn các im nh trong i tng. Dùng phân b Gauss trong không gian màu RGB ã c chun hóa, c các ng viên ri dùng phân loi xác nh cui cùng ng viên nào là khuôn mt ngi. Cùng các tip cn này có Darrell [84]. Hsu c xem là ngi khá thành công khi xác nh khuôn mt ngi trong nh màu [1, 96]. Ông xây dng mt b phân loi xác nh các v trí ca ng viên mt và ming da trên sc màu c trng ca mt và ming. Trên quan h v khong cách ca hai mt và ming xác nh ng viên nào s là khuôn mt thông qua bin i Hough có ng viên nào gn ging dng ellipse nht. Jesorsky [270] xác nh cnh ca các i tng trong nh ri so sánh hình dáng kt hp dùng khong cách Hausdorff o mc tng t ca khuôn mt ngi vi các mu. Sau ó Kirchberg [17] ci tin dùng mô hình Gen (Genetic Model) phát sinh mô hình khuôn mt ngi t d liu ln xn sau khi phân on trong nh xám kt hp khong cách Hausdorff. Mc chính xác khang 85%. Yen và Nithianandan [66] dùng GA trích các c trng khuôn mt, nh mt (lông mày), mi, và ming. Áp dng hình thái khuôn mt ging hình ellipse xác nh khuôn mt bng GA trong nh màu. Phng pháp này cho phép gii quyt trong iu kin ánh sáng khác nhau, t th khuôn mt khác nhau. Chang [89] xem xét tính a dng v mt ca khuôn mt ngi. T ây ông xây dng mng wavelet tích cc (Active Wavelet Network) trích các c trng ca khuôn mt ri dùng hai phng

8

pháp làm gim s chiu ca không gian c trng là LLE (Locally Linear Embedding) và LE (Lipschitz Embedding) và hc cu trúc a dng này xác nh khuôn mt. Daidi và Irek [117] trích các c trng ca khuôn mt bng s phân b tham s xác nh khuôn mt ngi. T l chính xác cho nh xám và khuôn mt c chp thng là 91.4%. Ehsan và Jonh [125] dùng tp h s Gabor wavelet các hng khác nhau trích các c trng ca khuôn mt. Sau ó dùng entropy cc b xác nh khuôn mt trong nh xám và khuôn mt c chp thng hay ta thng nhng có các v trí khác nhau. T l chính xác là 94%. Bao [281, 282] dùng sc thái màu da ngi xác nh ng viên trong nh màu. Tác gi ã xây dng các lut m da vào hai loi c trng: (1) bên ngoài và (2) bên trong. c trng bên ngoài gm: t l chiu cao, din tích, chu vi, mc tròn, ... c trng bên trong gm: quan h mc cân i ca hai mt và ming cng nh t l khong cách vi khuôn mt. Phng pháp này cho phép xác nh khuôn mt nhiu t th, v trí, mc nghiêng khác nhau trong môi trng phc tp. c bit, tác gi ã xây dng b iu khin m tách các khuôn mt dính ln nhau. T l chính xác khong 87%89%. 3. Hng tip cn da trên so khp mu Trong so khp mu, các mu chun ca khuôn mt (thng là khuôn mt c chp thng) s c xác nh trc hoc xác nh các tham s thông qua mt hàm. T mt nh a vào, tính các giá tr tng quan so vi các mu chun v ng vin khuôn mt, mt, mi và ming. Thông qua các giá tr tng quan này mà các tác gi quyt nh có hay không có tn ti khuôn mt trong nh. Hng tip cn này có li th là rt d cài t, nhng không hiu qu khi t l, t th, và hình dáng thay i (ã c chng minh). Nhiu phân gii, a t l, các mu con, và các mu bin dng c xem xét thành bát bin v t l và hình dáng. Oh [119] phân on tìm ng viên khuôn mt, tác gi dùng các mu mt có trc so khp vi các vùng quan tâm tìm v trí mt trong ng viên.

Sau ó tip tc tìm ming và lông mày xác nh ng viên này có phi là khuôn mt ngi hay không. a) Xác nh các mu trc Sakai ã c gng th xác nh khuôn mt ngi chp thng trong nh [232]. Ông dùng vài mu con v mt, mi, ming, và ng vin khuôn mt mô hình hóa mt khuôn mt. Mi mu con c nh ngha trong gii hn ca các on thng. Các ng thng trong nh c trích bng phng pháp xem xét thay i gradient nhiu nht và so khp các mu con. u tiên tìm các ng viên thông qua mi tng quan gia các nh con và các mu v ng vin. Sau ó, so khp vi các mu con khác. Hay nói mt cách khác, giai on u xem nh là giai on s ch tìm ng viên, giai an th hai là giai on tinh ch xác nh có tn ti hay không mt khuôn mt ngi. Ý tng này c duy trì cho n các nghiên cu sau này. Craw a ra mt phng pháp xác nh khuôn mt ngi da vào các mu v hình dáng ca các nh c chp thng (dùng v b ngoài ca hình dáng khuôn mt) [163]. u tiên dùng phép lc Sobel tìm các cnh. Các cnh này s c nhóm li theo mt s ràng buc. Sau ó, tìm ng vin ca u, quá trình tng t c lp i lp li vi mi t l khác nhau xác nh các c trng khác nh: mt, lông mày, và môi. Sau ó Craw mô t mt phng thc xác nh dùng mt tp có 40 mu tìm các c trng khuôn mt và iu khin chin lc dò tìm [164]. Govindaraju ngh mt phng thc xác nh khuôn mt ngi có hai giai an phát sinh các gi thuyt khuôn mt và kim tra nó [177, 178, 179]. Mt mô hình khuôn mt c xây dng trong các giai on xác nh c trng bng các cnh. Các c trng c mô t nh các ng cong ca phía bên trái, ng vin tóc, phía bên phi ca khuôn mt c chp thng. Dùng phép toán Marr-Hildreth xác nh cnh. Sau ó dùng mt b lc loi b các i tng không tham gia vào xây dng khuôn mt. Liên kt các cp ca các on ng vin trên c s mc k và các hng liên quan. Xác nh các góc phân on ng vin thành các ng cong c trng. Gán nhãn các ng cong c trng bng cách kim tra thuc tính hình hc và các v trí

9

liên quan trong láng ging ca nó. Ni các cp ca các ng cong c trng thông qua các cnh nu các thuc tính ca nó tng thích. So sánh các t l ca các cp thuc tính cho mt cnh và n ng mt giá tr tng ng. Nu giá tr ca mt nhóm ca ba ng cong c trng (vi các nhãn khác nhau) thp thì nhóm này s tr thành mt gi thuyt. Khi xác nh khuôn mt trong các bài báo thì thông tin ph s c dùng thêm ó là s lng ngi trong nh chn gi thuyt ti u [178] . T l chính xác ca phng pháp này là 70%, tuy nhiên các khuôn mt phi c chp thng và không b che khut. Venkatranman và Govindaraju dùng cách tip cn tng t, nhng dùng wavelet trích cnh [257]. Tsukamoto trình bày mt mô hình hiu qu khi dùng mu khuôn mt (QMF) [253, 254]. Trong QMF , mi nh mu c chia thành nhiu khi, các c trng hiu qu c c lng cho mi khi. Tham s hóa mt mu khuôn mt theo: lightness và edgeness là các c trng trong mô hình. Sau ó dùng các mu (ã c chia thành các khi) tính giá tr faceness (mc là khuôn mt) ti mi v trí ca nh. Mt khuôn mt c xác nh khi giá tr faceness vt mt ngng ã c cho trc. Hình chiu c dùng nh các mu xác nh khuôn mt ngi [233]. Dùng PCA (phân tích thành phn chính ­ Principal Component Analysis - PCA) có mt tp hình chiu c bn t các mu khuôn mt, hình chiu c mô t nh mt mng các bit. Dùng c trng hình chiu riêng kt hp bin i Hough xác nh khuôn mt ngi. Sau ó mt phng pháp xác nh da trên a loi mu xác nh các thành phn ca khuôn mt c trình bày [244]. Phng pháp này nh ngha mt s gi thuyt mô t các kh nng ca các c trng khuôn mt. Vi mt khuôn mt s có mt tp gi thuyt, lý thuyt DepsterShafer [166]. Dùng mt nhân t tin cy kim tra s tn ti hay không ca các c trng ca khuôn mt, và kt hp nhân t tin cy này vi mt o xem xét có hay không có khuôn mt trong nh. Sinha dùng mt tp nh các bt bin nh trong không gian nh mô t không gian các mu nh [238, 239]. T tng chính ca ông da vào s thay i mc sáng ca các vùng khác nhau ca khuôn

mt (nh hai mt, hai má, và trán), quan h v mc sáng ca các vùng còn li thay i không áng k. Xác nh các cp t s ca mc sáng ca mt s vùng (mt vùng ti hn hay sáng hn) cho ta mt lng bt bin khá hiu qu. Các vùng có sáng u c xem nh mt mu t s mà là mu thô trong không gian nh ca mt khuôn mt vi thích hp ít dùng chn nh các c trng chính ca khuôn mt nh hai mt, hai má, và trán. Lu gi thay i sáng ca các vùng trên khuôn mt trong mt tp thích hp vi các cp quan h sáng hn ­ ti hn gia các vùng nh. Mt khuôn mt c xác nh khi mt nh tha tt c các cp sáng hn ­ ti hn. Ý tng này xut phát t s khác bit ca cng gia các vùng k cc b, sau này c m rng trên c s bin i wavelet biu din cho xác nh ngi i b, xác nh xe hi, xác nh khuôn mt [222]. Ý tng ca Sinha còn c áp dng cho h thng th giác ca robot [151, 236]. Hình 5 cho thy mu ni bt trong 23 quan h c nh ngha. Dùng các quan h này phân loi, có 11 quan h thit yu (các mi tên màu en) và 12 quan h xác thc (các mi tên xám). Mi mi tên là mt quan h. Mt quan h tha mãn mu khuôn mt khi t l gia hai vùng vt qua mt ngng và 23 quan h này vt ngng thì xem nh xác nh c mt khuôn mt.

Hình 5: Mt mu khuôn mt, có 16 vùng và 23 quan h (các mi tên).

Phng pháp so khp mu theo th t xác nh khuôn mt ngi do Miao trình bày [214]. giai on u tiên, nh s c xoay t -20o n 20o vi mi bc là 5o và theo th t. Xây dng nh a phân gii, hình 1, ri dùng phép tóan Laplace xác nh các cnh. Mt mu khuôn mt gm các cnh mô t sáu thành phn: hai lông mày, hai mt, mt mi, và mt ming. Sau ó áp dng heuristic xác nh s tn ti ca khuôn mt trong nh, phng pháp này cho phép xác nhiu khuôn mt, nhng kt

10

qu không tt bng xác nh mt khuôn mt (chp thng hoc xoay) trong nh xám. Wei và Lai [78] dùng b lc phân on kt hp thut toán tìm láng ging gn nht xác nh ng viên khuôn mt, t ng viên này sau ó so khp vi các mu ã xác nh trc bit ng viên có phi là khuôn mt hay không. T l chính xác là 80%. Darrell [84] dùng phân on tìm ng viên, dùng ng viên này xác nh khuôn mt ngi da vào mu ri theo vt chuyn ng ca ngi. Dowdall dùng ph ca màu da ngi xác nh ng viên. Sau ó chiu các ng viên này so sanh vi các mu có trc xác nh ng viên nào là khuôn mt ngi. Phng pháp này ch xác nh cho khuôn mt chp thng và gn thng, góc quay khong t -10o n 10o [86]. Holst xây dng mt h thng t các mu vi các c trng kép [92]: (1) thành phn, gm: mt, mi, và ming; (2) hình dáng khuôn mt, trên phân gii thp. Ông dùng hai phng pháp tìm kim trong không gian d liu ca mình xác nh khuôn mt ngi.

Iwata [39] xây dng mu mi c trng gm bn c trng theo bn hmg: ngang, bên phi phía trên, ng, và bên trái phía trên ca khuôn mt chp thng hoc gn thng trong nh xám. so khp tng phn ca mu kt hp xác sut các láng ging. T l chính xác ca phng pháp này là gn 99%. Keren [33] xây dng khái nim Antifaces xác nh khuôn mt ngi (tng quát cho các i tng 3-chiu). Da trên nhiu loi mu kt hp gi thuyt phân b xác sut tìm nhng i tng không có mi tng quan tìm khuôn mt ngi. Ông cho bit, phng pháp này nhanh hn eigenface và SVM và mc chính xác gn tng ng. Feris [59] dùng mng wavelet th nht xác nh ng viên khuôn mt khi so khp vi các mu ã hc trc. Sau ó tác gi dùng mng wavelet th hai xác nh các thành phn nh mt, mi, và ming thông qua các c trng góc cnh. T các thành phn này xem xét tính hòa hp có quyt nh cui cùng ng viên nào là khuôn mt ngi. b) Các mu b bin dng Yuille dùng các mu bin dng mô hình hóa các c trng ca khuôn mt, mô hình này có kh nng linh hot cho các c trng khuôn mt [268]. Trong hng tip cn này, các c trng khuôn mt c mô t bng các mu c tham s hóa. Mt hàm nng lng (giá tr) c nh ngha liên kt các cnh, nh, và thung lng trong nh tng ng vi các tham s trong mu. Mô hình này tt nht khi ti thiu hàm nng lng qua các tham s, Mc dù kt qu tt vi mu bin dng trong theo vt i tng trên c trng không mô hình theo li, mt hn ch ca hng tip cn này là các mu bin dng phi c khi to trong phm vi gn các i tng xác nh. Mt hng tip cn da trên dng gp khúc (snake) [193, 208] và các mu xác nh khuôn mt [202]. u tiên mt nh s c làm xon li bi mt lc làm m ri dùng phép toán morphology làm ni bt cnh lên. Dùng mt ng gp khúc có n im nh (giá tr n nh) tìm và c lng các an cong nh. Mi khuôn mt c xp x bng mt ellipse và bin i Hough, ri tìm mt ellipse ni tri nht. Mt tp có bn tham s mô t nt ellipse c dùng nh ng viên xác nh

Hình 6: Phân nhóm d liu khuôn mt và nhóm d liu không phi khuôn mt.

Froba và Zink lc cnh phân gii thp ri dùng bin i Hough so khp mu theo hng cnh xác nh hình dáng khuôn mt dng chp hình thng dng xám. T l chính xác trên 91% [25]. Shu và Jain xây dng ng ngha khuôn mt [85]. Ng ngha theo hình dáng và v trí các thành phn khuôn mt. Hai ông t b ng ngha này xây dng mt th quan h d dàng so khp khi xác nh khuôn mt ngi.

11

khuôn mt. Vi mi ng viên, mt phng thc tng t nh phng thc mu bin dng [268] dùng xác nh các c trng mc chi tit. Nu tìm thy s lng áng k các c trng khuôn mt và tha t l cân i thì xem nh ã xác nh c mt khuôn mt. Lam và Yan cng dùng ng gp khúc xác nh v trí u vi thut toán greedy cc tiu hóa hàm nng lng [203]. Thay vì dùng ng gp khúc thì Huang và Su [13] dùng lý thuyt dòng chy xác nh ng vin khuôn mt da trên c tính hình hc. Hai ông dùng lý thuyt tp ng mc (Level Set) loang t các khi ng ban u có c các khuôn mt ngi. Lanitis mô t mt phng pháp biu din khuôn mt ngi vi c hai thông tin: hình dáng và cng [204]. Bt u vi các tp nh c hun luyn vi các ng vin mu nh là ng bao mt, mi, cm/má c gán nhãn. Dùng mt vector các im mu mô t hình dáng. Tác gi dùng mt mô hình phân b im (Point Distribution Model ­ PDM) mô t vector hình dáng qua toàn b các cá th. Dùng tip cn nh Kirby và Sirovich [198] mô t cng b ngòai ca hình dáng ã c chun hóa. Mt PDM có hình dáng nh khuôn mt dùng xác nh khuôn mt bng mô hình hình dáng tích cc (Active Shape Model - ASM) tìm kim và c lng v trí khuôn mt cng nh các tham s v hình dáng. Các mnh ca khuôn mt c làm bin dng v hình dáng trung bình ri trích các tham s cng . Các tham s hình dáng và cng c dùng phân loi. Cootes và Taylor áp dng cách tip cn này xác nh khuôn mt [161]. u tiên, hai ông nh ngha nt vùng hình ch nht cha các c trng quan tâm. Dùng phân tích nhân t [146] làm va các c trng hun luyn có mt hàm phân b. Có uc các c trng là ng viên nu o xác sut vt qua mt ngng khi dùng ASM. Sau khi hun luyn xong có th xác nh khuôn mt ngi. Hng tip cn theo ASM c m rng bng hai lc Kalman c lng các tham s v hình dáng và cng dùng theo vt khuôn mt ngi [169].

4. Hng tip cn da trên din mo Trái ngc vi các phong pháp so khp mu vi các mu ã c nh ngha trc bi nhng chuyên gia, các mu trong hng tip cn này c hc t các nh mu. Mt các tng quát, các phng pháp theo hng tip cn này áp dng các k thut theo hng xác sut thng kê và máy hc tìm nhng c tính liên quan ca khuôn mt và không phi là khuôn mt. Các c tính ã c hc trong hình thái các mô hình phân b hay các hàm bit s nên dùng có th dùng các c tính này xác nh khuôn mt ngi. ng thi, bài toán gim s chiu thng c quan tâm tng hiu qu tính toán cng nh hiu qu xác nh. Có nhiu phng pháp áp dng xác sut thng kê gi quyt. Mt nh hay mt vector c trng xut phát t mt nh c xem nh mt bin ngu nhiên x, và bin ngu nhiên có c tính là khuôn mt hay không phi khuôn mt bi công thc tính theo các hàm mt phân lp theo iu kin p(x | khuoâ maë và p(x | khoâg phaûkhuoâ maë . n t) n i n t) Có th dùng phân loi Bayes hoc kh nng cc i phân loi mt ng viên là khuôn mt hay không phi là khuôn mt. Không th cài t trc tip phân loi Bayes bi vì s chiu ca x khá cao, bi vì p(x | khuoâ maë và p(x | khoâg phaûkhuoâ maë n t) n i n t) là a phng thc, và cha th hiu nu xây dng các dng tham s hóa mt cách t nhiên cho p(x | khuoâ maë và p(x | khoâg phaûkhuoâ maë . n t) n i n t) Có khá nhiu nghiên cu theo hng tip cn này quan tâm xp x có tham s hay không có tham s cho và p(x | khuoâ maë n t)

p(x | khoâg phaûkhuoâ maë . n i n t)

Các tip cn khác trong hng tip cn da trên din mo là tìm mt hàm bit s (nh: mt phng quyt nh, siêu phng tách d liu, hàm ngng) phân bit hai lp d liu: khuôn mt và không phi khuôn mt. Bình thng, các mu nh c chiu vào không gian có s chiu thp hn, ri sau ó dùng mt hàm bit s (da trên các o khong cách) phân loi [255], hoc xây dng mt quyt nh phi tuyn bng mng neural a tng [48]. Hoc dùng SVM (Support Vector Machine) và các phng thc kernel, chiu hoàn toàn các mu vào

12

không gian có s chiu cao hn d liu b ri rc hoàn toàn và ta có th dùng mt mt phng quyt nh phân loi các mu khuôn mt và không phi khuôn mt [220]. a) Eigenface Kohonen ã a ra phng pháp dùng vector riêng nhn dng khuôn mt [199], ông dùng mt mng neural n gin chng t kh nng ca phng pháp này trên các nh ã c chun hóa. Mng neural tính mt mô t ca khuôn mt bng cách xp x các vector riêng ca ma trn tng quan ca nh. Các vector riêng sau này c bit n vi cái tên Eigenface. Kirby và Sirovich chng t các nh có các khuôn mt có th c mã hóa tuyn tính bng mt s lng va phi các nh c s [198]. Tính cht này da trên bin i Karhunen-Lòeve [176, 192, 211], mà còn c gi di mt cái tên khác là PCA [189] và bin i Hotelling [104]. Ý tng này c xem là ca Pearson trình bày u tiên vào nm 1901 [223] và sau ó là Hotelling vào nm 1933 [185]. Cho mt tp các nh hun luyn có kích thc n x m c mô t bi các vector có kích thc m x m, các vector c s cho mt không gian con ti u c xác nh thông qua li bình phng trung bình khi chiu các nh hun luyn vào không gian con này. Các tác gi gi tp các vector c s ti u này là nh riêng sau ó gi cho n gin là vector riêng ca ma trn hip phng sai c tính t các nh khuôn mt ã vector hóa trong tp hun luyn. Nu cho 100 nh, mà mi khuôn mt có kích thc 91x50 thì có th ch dùng 50 nh riêng, trong khi vn duy trì c mt kh nng ging nhau hp lý (gi c 95% tính cht). Turk và Pentland áp dng PCA xác nh và nhn dng khuôn mt [255]. Tng t [198], dùng PCA trên tp hun luyn nh các khuôn mt sinh các nh riêng (còn gi là eigenface) tìm mt không gian con (không gian khuôn mt) trong không gian nh. Các nh khuôn mt c chiu vào không gian con này và c gom nhóm li. Tng t các nh không có khuôn mt dùng hun luyn cng c chiu vào cùng không gian con và gom nhóm li. Các nh khi chiu vào không gian khuôn mt thì không b thay i tính cht c bn, trong khi chiu

các nh không có khuôn mt thì xut hin s khác nhau cng không ít. Xác nh s có mt ca mt khuôn mt trong nh thông qua tt c khong cách gia các v trí trong nh và không gian nh. Khong cách này dùng xem xét có hay không có khuôn mt ngi, kt qu khi tính toán các khong cách s cho ta mt bn v khuôn mt. Có th xác nh c t cc tiu a phng ca bn này. Có nhiu nghiên cu v xác nh khuôn mt, nhn dng, và trích c trng t ý tng vector riêng, phân rã, và gom nhóm. Sau ó Kim [23] phát trin cho nh màu, bng cách phân on nh tìm ng không gian tìm kim bt i. b) Hng tip cn da trên phân b Sung và Poggio phát trin mt h thng xác nh khuôn mt ngi da trên phân b [246, 247], chng t bng cách dùng phân b các các mu nh cùng mt lp i tng có th c hc t các mu negative và positive. H thng ca hai ông bao gm hai thành phn: mô hình phân b ca các mu là khuôn mt/không phi khuôn mt và mt phân loi a tng da vào th giác. Mi mu là khuôn mt và không phi là khuôn mt c chun hóa và x lý thành nh có kích thc 19 x 19 im nh và xem nh mt vector hay mu có 361-chiu. Sau ó các mu c nhóm vào các nhóm, mi nhóm gm sáu mu cùng loi là khuôn mt hoc nhóm không phi là khuôn mt bng thut toán k-trung bình (k-mean), hình 6. Mi nhóm s c mô t nh mt hàm Gauss a chiu vi mt nh trung bình và ma trn hip phng sai. Hình 7 cho thy cách tính khong cách ca hai ông. Hai o khong cách dùng tính khong cách gia nh a vào và tâm ca nhóm. Thành phn khong cách u tiên là khong cách Mahalanobis c chun hóa gia hình chiu ca mu cn kim tra và tâm ca nhóm, tính trong không gian con có s chiu thp hn, c mô t bng 75 vector riêng ln nht. Thành phn khong cách th hai là khong cách Euclide gia mu cn kim tra và hình chiu ca nó trong không gian con có 75- chiu này. Dùng hai khong cách này xác nh khong cách t mu cn kim tra n tâm mt nhóm. T nay chúng ta có th bit mu cn kim tra gn nhóm nào nht. Bc cui cùng dùng mng a tng (Multilayer Perceptron Network ­ MLP)

13

phân loi da vào 12 cp khong cách (có 12 nhóm) khi mng này ã c hun luyn trc ó. D dàng chn mu khuôn mt hun luyn, nhng không d chn mu không phi là khuôn mt hun luyn. Dùng phng pháp bootstrap gi gii quyt vn này. Bt u t tp nh không phi khuôn mt trong tp mu hun luyn hun luyn MLP. Dùng b xác nh khuôn mt ngi xác nh mt ngi trên mt dãy các nh ngu nhiên, sau ó chn các mu không phi khuôn mt ngi mà b xác nh là khuôn mt ngi xem nh là mu không phi khuôn mt ngi mi hun luyn tip tc. Phng pháp này b qua vn chn mu nào trong các mu tng tính hiu qu, có nhiu nghiên cu sau này v vn này [48, 220].

Hình 7: (a) Khong cách gia mu cn kim tra và các nhóm; (b) hai thành phn khong cách.

Moghaddam và Pentland a ra mt mô hình hc theo xác sut da trên c lng mt trong không gian có s chiu cao bng không gian riêng [216]. Hai ông dùng PCA tìm không gian con mô t tt nht mt tp các mu khuôn mt ngi. Phng pháp này vn gi li các mi tng quan tuyn tính chính trong d liu và loi b các th yu khác. Phng pháp này phân rã mt không gian vector thành hai không gian con mà hai không gian con này loi tr ln nhau và cng b sung cho nhau: không gian con chính (không gian c trng) và phn bù trc giao. Vì th, mc tiêu mt c phân rã làm hai thành phn: mt trong không gian chính (da vào các thành phn chính) và phn bù trc giao, hình 8. Xây dng h thng hc da vào Gauss nhiu bin và Gauss hn hp, h thng này hc da trên thng kê các c trng cc b ca mt khuôn mt. Dùng các mt xác sut xác nh khuôn mt trên c s c lng kh nng cc i. Phngpháp

này uc áp dng cho xác nh khuôn mt, mã hóa khuôn mt, và nhn dng. So sánh vi hng tip eigenface c in [255], phng pháp này cho thy hiu qu hn trong xác nh và nhn dng khuôn mt [196]. Yang s dng mt hn hp nhiu phân tích h s làm tiêu chí xác nh khuôn mt. Phân tích h s (Factor Analysis ­ FA) là mt phng pháp thng kê mô hình hóa tính hip bin cu trúc ca d liu có s chiu cao bng cách dùng m lng nh các bin tim tàng. FA cng tng t PCA trong vài khía cnh. Tuy nhiên, PCA không ging FA, không nh ngha mt mô hình mt thích hp cho d liu. Hn na, PCA không hiu qu khi có nhiu c lp trong các c trng ca d liu. Tng hp t [148, 150, 167, 168] cho thy các mu c chiu t các lp khác nhau vào không gian con PCA thng có th không hiu qu. Trong các trng hp khi các mu có mt cu trúc chc chn, dùng PCA s cho kt qu khá tt. Hinton dùng FA nhn dng các con s, ông ã so sánh FA và PCA [184]. Mt mô hình hn hp ca các phân tích h s c m rng nhn dng khuôn mt ngi [174]. C hai nghiên cu u cho thy FA tt hn PCA. T t th, hng, cm xúc, và nh hng ánh sáng trên din mo ca khuôn mt ngi, phân b các khuôn mt trong không gian nh có th c biu din tt hn bng mt mô hình mt a phng thc khi mi phng thc gi các c tính chc chn ca din mo chc chn ca khuôn mt. H ã trình bày mt mô hình theo xác sut khi dùng mt hn hp các phân tích h s (Mixture of Factor Analyzer ­ MFA) xác nh khuôn mt ngi. Dùng thut toán EM c lng các tham s trong mô hình hn hp.

Hình 8: Phân rã mt nh khuôn mt vào không gian chính F và phn bù trc giao F .

---

Phng pháp th hai [263] dùng bit s tuyn tính Fisher (Fisher's Linear Discriminant ­ FLD) chiu các mu t không gian nh có s chiu cao sang mt không gian c trng có s chiu thp hn. 14

Và trên c s phân tích bit s tuyn tính, các tác gi ã xây dng phng pháp Fisherface [148] và nhng phng pháp khác [249, 269] gii quyt tt hn phng pháp Eigenface [255] trong nhn dng khuôn mt. Khi dùng FLD phân loi mu s tt hn PCA khi chiu. Do ó, kt qu phân loi trong không gian con ã c chiu có th khá hn các phng pháp khác ( [213] trình bày rõ v kích thc tp hun luyn). Trong phng thc th hai, các tác gi ã phân rã các mu hun luyn khuôn mt và không phi khuôn mt vào trong vài lp con bng ánh x t t chc Kohonen (Kohonen's Self Organizing Map ­ SOM) [199]. Hình 9 cho thy mt i din ca mi lp khuôn mt. T các mu c gán nhãn li, tính các ma trn các giá tr ri rc v tính cht mu trong lp hay gia lp, bng cách ó phát sinh phép chiu ti u trên c s FLD. Mi nhóm con, mô hình ha mt nh mt phng thc Gauss vi các tham s trong Gauss c c lng bng phng pháp cc i hóa kh nng [167]. Quét trên toàn b nh a vào bng mt ca s ri tính xác sut mc ph thuc lp. Dùng lut quyt nh da trên cc i hóa kh nng xác nh có phi là khuôn mt hay không. C hai phng pháp trong [263] có t l chính xác là 92.3% cho MFA và 93.6% khi dùng FLD.

c) Mng Neural Mng neural c áp dng khá thành công trong các bài toán nhn dng mu, nh: nhn ký t, i tng, robot t vn hành. Xác nh khuôn mt ngi có th xem là bài toán nhn dng hai loi mu, có nhiu kin trúc mng neural ã c trình bày. Mt thun li khi dùng mng neural xác nh khuôn mt là tính kh thi ca h thng hc khi có s phc tp trong lp ca các mu khuôn mt. Tuy nhiên, mt iu tr ngi là các kin trúc mng u tng quát, khi áp dng thì phi xác nh rõ ràng s lng tng, s lng node, t l hc, ..., cho tng trng hp c th, hình 10.

Hình 10: Mô hình mng Neural theo Rowley

Hình 9: i din ca mi lp khuôn mt. Mi i din tng ng tâm ca mt nhóm.

Choi [31] xây dng h thng xác nh khuôn mt ngi trong nh màu bng c trng ca mt ngi thông qua phân on xác nh ng viên khuôn mt da trên phân b màu da ca khuôn mt.

Agui trình bày mng neural x lý có th t [143]. Gia on u dùng hai mng con song song mà d liu vào là các giá tr cng ca nh ban u và các giá tr cng ca nh ã c lc bng thut toán lc Sobel vi ca s lc 3x3. u vào ca mng giai on hai bao gm d liu u ra t hai mng con và các giá tr c trng ã c trích ra, nh: c trng lch chun ca các giá tr im nh trong mu a vào, mt t l ca s im nh trng trên tng s im nh (ã chuyn sang nh nh phân) trong mt ca s, và c trng thit yu v hình hc. Mt giá tr xut ti giai on hai cho bit có tn ti hay không khuôn mt ngi trong vùng a vào. Qua kinh nghim, tác gi ch ra rng nu các nh cùng mt kích thc thì mi dùng phng pháp này c. Propp và Samal phát trin mng neural xác nh khuôn mt ngi sm nht [224]. Mng neural ca hai ông gm bn tng vi 1,024 u vào, 256 u k tip trong tng n th nht, tám u k tip trong tng n th hai, và hai u ra. Tng t nh mng neural x lý theo th t c a ra sau ó [251]. Phng pháp ca Soulie [242] duyt mt nh a vào vi mng neural có thi gian tr [258] (kích thc ca s là 20x25 im nh) xác nh khuôn mt. Dùng bin i wavelet phân rã nh các phn 15

có kích thc khác nhau xác nh khuôn mt. Vaillant dùng mng neural dng xon xác nh khuôn mt ngi [256]. u tiên to các nh mu khuôn mt và không phi khuôn mt có kích thc 20x20. Dùng mt mng neural, mng này ã c hun luyn, tìm các v trí tng i ca các khuôn mt các t l khác nhau. Ri dùng mt mng khác xác nh v trí chính xác ca các khuôn mt. Mng u tiên dùng tìm các ng viên khuôn mt, ri dùng mng th hai xác nh ng viên nào that s là khuôn mt. Burel và Carel dùng mng neural a tng có ít mu hn vi thut toán Kohenen's SOM hc các mu khuôn mt và hình nn, mà các mu này ã c phân loi trc. Giai on xác nh khuôn mt bao gm duyt trên mi nh ã c bin i t nh bàn u các phân gii khác nhau. ti mi v trí và kích thc ca s duyt, iu chnh sáng. Mi ca s ã c chun hóa s c phân loi bng MLP. Feraud và Bernier dùng mng neural kt hp t ng [171, 172, 173]. Ý tng da trên [201] mng kt hp t ng có nm tng thì có th biu din mt phân tích thành phn chính phi tuyn. Dùng mt mng kt hp t ng xác nh các khuôn mt chp thng ri m rng bng cách xoay 60 t trái sang phi khuôn mt chp thng, mng này s tn dng các trng s khi xây dng vi d liu khuôn mt chp thng cho các t th mi. Hai ông cho bit kt qu cng tng t [231]. Phng pháp này cng dùng cho LISTEN [159] và MULTRAK [149]. Lin xây dng mng neural quyt nh trên c s xác sut (Probabilistic Decision-based Neural Network ­ PDBNN) [209]. Kin trúc ca PDBNN thì tng t mt mng có hàm trên nn tng tng t tia (Radial Basis Function ­ RBF) vi các lut hc c h tr xác sut. Thay vì chuyn toàn b nh khuôn mt thành mt vector có các giá tr cng hun luyn cho mng neural, ông s trích vector c trng da trên cng và thông tin cnh trong vùng khuôn mt có cha lông mày, mt, và mi. Hai vector c trng ã c trích thì a vào hai PDBNN và hp nht các kt qu có kt qu phân loi. Trên c s 23 nh ca Sung và Poggio [248]. Ông ã cho mt s kt qu so sánh vi các mng khác [48, 248].

Theo ánh giá các phng pháp dùng mng neural xác nh khuôn mt ngi ca nhiu tác gi, thì nghiên cu ca Rowley [48, 231] c xem là tt nht i vi nh xám. Mt mng a tng c dùng hc các mu khuôn mt và không phi khuôn t các nh tng ng (da trên quan h cng , v mt không gian ca các im nh) trong khi Sung [246] dùng mng neural xác nh mt hàm bit s cho mc ích phân loi mu có phi là khuôn mt hay không da vào o khong cách. Hai ông cùng dùng nhiu mng neural và vài phng thc quyt nh ci thin kt qu, trong khi Burel và Carel [153] dùng mt mng n, và Vaillant [256] dùng hai mng phân loi. Có hai thành phn chính x lý: nhiu mng neural (xác nh mu nào là khuôn mt) và mt mô un quyt nh (a ra quyt nh cui cùng t nhiu kt qu xác nh). Hình 9, thành phn u tiên ca phng pháp này là mt mng neural nhn mt vùng nh có kích thc 20x20 im nh và xut ra mt giá trc trong khong t -1 n 1. Khi a vào mt nh, nu kt qu gn -1 thì ngha là mu này không phi là khuôn mt ngi, nhng nu kt qu gn 1 thì ây chính là khuôn mt ngi. xác nh khuôn mt có kích thc ln hn 20x20 im nh, c chn mt t l ri duyt ri xác nh, ri li thay i t l (bin thiên t l này do ngi xây dng quyt nh). Gn 1050 mu khuôn mt có kích thc, hng, v trí, và cng khác nhau dùng hun luyn mng. S gán nhãn cho mt, nh ca mi, góc cnh, và tâm ca ming ri dùng chun hóa khuôn mt v cùng mt t l, hng, và v trí. Thành phn th hai là phng pháp trn các xác nh chng chéo nhau và a ra quyt nh. Phép toán logic (AND/OR) là mt quyt nh n gin nht và phng pháp bu c c dùng tng tính hiu qu. Rowley [48] a nhiu cách gii quyt bài toán quyt khác nhau nhng chi phí tính toán ít hn Sung và Poggio nhng t l chính xác cao hn. Mt gii hn ca phng pháp ca Rowley [48] và Sung [246] là chí có th xác nh khuôn mt chp thng và ta thng (nghiêng u). Sau ó Rowley [49] ci tin có th xác nh khuôn mt b xoay bng mng nh hng (Router Network), hình 11, s thêm tin trình xác nh hng khuôn mt và

16

xoay v li t th chun (chp thng), tuy nhiên khi quay li d liu nh trên thì t l chính xác li gim i, ch còn khong 76.9%.

Hình 11: Mt ví d cho d liu vào và d liu ra ca mng nh hng.

Lee [71] phát trin ý tng ca Rowley [48] cho xác nh khuôn mt trong nh màu. Ông dùng mô hình màu da ngi bng Gauss xác nh các ng viên, sau ó loi bt nhng ng viên nào không tha mãn tính cht hình dáng gn ging hình ellipse. Cui cùng ông dùng mt mng neural ã c hun luyn xác nh khuônmt ngi. T l xác nh chính xác là 88.9%, còn t l xác nh sai là 11.1%. Da trên nghiên cu ca Rowley [48], Hazem [108] ci tin tc x lý tng lên áng k. Kwolek [131] dùng b lc Gabor trích c trng, dùng c trng này hun luuyn cho mng neural xon. Mng neural xon là mng neural mà mi node mi tng có th liên kt vi các làng ging cc b tng phía trc ca nó. T l chính xác là 87.5%. d) SVM Support Vector Machine (SVM) ã c Osuna [220] áp dng u tiên xác nh khuôn mt ngi. SVM c xem nh là mt kiu mi dùng hun luyn phân loi theo hàm a thc. Trong khi hu ht các phng pháp khác hun luyn phân loi (Mng Bayes, Nueral, RBF) u dùng tiêu chí ti thiu li hun luyn (ri ro do kinh nghim), trong khi SVM dùng quy np (c gi là ti thiu ri ro cu trúc), mc tiêu là làm ti thiu mt bao bên trên trên li tng quát. Mt phân loi SVM là mt phân loi tuyn tính, dùng mt siêu phng tách d liu. Da trên mt kt hp có các trng s ca mt tp con nh các vector hun luyn, các vector này c gi là support vector. c lng siêu phng thì tng ng gii mt bài toán tuyn tính bc hai. Osuna [220] ã phát trin mt phng pháp hiu qu hun luyn mt SVM vi t l ln áp dng cho bài toán xác nh khuôn mt ngi. 17

Ông dùng 10,000,000 mu có kích thc 19x19 im nh, h thng ca ông có t l li ít hn Sung và Poggio [247], nhng nhanh hn gn 30 ln. SVM cng có th dùng xác nh khuôn mt ngi và ngi i b vi phân tích Wavelet [219, 221, 222]. Shihong và Masato s dng bin i wavelet Gabor trích c trng ca khuôn mt cng nh không phi khuôn mt a vào cho SVM hc [15]. Kang và Lee [14] xây dng ng dng cho robot i b vt qua con ngi và chng ngi vt da trên xác nh khuôn mt. Hai ông dùng phân on ni kt hp SVM phân loi. Tng t Kui và Silva [22] cng xây dng ng dng cho phòng thông minh bng cách xác nh khuôn mt ngi da trên eigenface làm d liu cho SVM hc phân loi. Bileschi và Heisele [18] dùng phân gii thp hc thành phn khuôn mt trong nh xám vi các khuôn mt chp thng hoc ta thng cho SVM xác nh khuôn mt. Trong khi Terrillon [20] dùng tính cht màu da ngi tìm ng viên kt hp SVM và các mô men Fourier-Mellin trc giao gii quyt. Thay vì lc n gin, Shu-Fai và KwanYee [72] dùng QuaTree tìm ng viên khuôn mt ngi trong nh màu. Sau ó kt hp wavelet phân tích mu cho SVM hc trong nhiu t l. a phn khi cho SVM hc, các tác gi u dùng hai lp khuôn mt và không phi khuôn mt hc. Wang [75] ch dùng mt lp khuôn mt trong nh màu xác nh khuôn mt ngi. T l chính xác khong 81%. Fang và Qiu [83] kt hp SVM và thut toán leo i xác nh khuôn mt. Zhang và Zhao [51] xây dng SVM da trên histogram ca khuôn mt và không phi khuôn mt xác nh khuôn mt. T l chính xác khong 92% cho khuôn mt chp thng hoc gn thng trong nh màu. Je li xây dng nhiu SVM xác nh khuôn mt ngi theo th t quyt nh kt hp phng pháp bu c trong nh màu [30]. Julien [129] xây dng mt cu trúc SVM mi gm nhiu SVM kt ni song song vi nhau hc d liu t không gian eigenface. T l chính xác hn 93% trong nh xám vi khuôn mt n c chp thng.

e) Mng lc tha Yang xut mt phng pháp dùng mng lc d tha (Sparse Network of Winnows ­ SNoW) [181, 230] xác nh khuôn mt ngi vi các c trng khác nhau và biu din trong các t th khác nhau, và di iu kin ánh sáng khác nhau [264]. ng thi nghiên cu phng pháp hc s khai tt nh th nào khi dùng các c trng a t l. SNoW là mt mng tha dùng các hàm tuyn tính và dùng lc cp nht lut [210]. Phng pháp này thích hp cho hc trong min khi các c trng tim nng to các quyt nh sai khác nhau mà không bit mc u tiên. Mt vài c tính ca kin trúc hc này là rt him d liu có phân chung, có ch nh các c trng và liên kt trong d liu, k thut quyt nh, và cp nht lut hiu qu. T l li là 5.9%, hiu qu cng nh các phng pháp khác [48, 160, 220, 237]. Gundimada [4] da trên kin trúc SNoW xây dng ba mng, mng th nht phân loi da trên phân b cng , hai mng da trên phân b màu da ngi tìm ng viên kt hp phng pháp làm ni bt cnh. Xây dng các mu y t th ca khuôn mt, mi b phân loi s tng ng cho mt hng, mi hng lch nhau 10o. f) Phân loi Bayes Trái ngc vi các phng pháp trong [48, 220, 248] da vào din mo trên toàn khuôn mt, Schneiderman và Kanade mô t mt phân loi naive Bayes uc lng xác sut ni các din mo ti v trí cc b trên khuôn mt và v trí ca các mu khuôn mt ngi (các vùng con trên khuôn mt) trong nhiu phân gii [73, 237]. Hai ông nhn mnh tính cht din mo khuôn mt v trí cc b bi vì vi vài mu v trí cc b ca mt i tng s có tính cht duy nht, cng xung quanh mu mt thì c bit hn v trí má. ây là hai lý do dùng phân loi naive Bayes (không xem xét thng kê nhng ph thuc gia các vùng). u tiênphân loi này cung cp c lng tt hn ca các hàm mt có iu kin ca các vùng này. Th hai, mt phân loi Bayes cung cp mt dng hàm ca theo xác sut nhn thng kê ca din mo v trí cc b và v trí ca nó trên i tng. Ti mi t l, mt nh khuôn mt ngi c phân rã làm bn vùng hình ch nht con. Chiu các vùng này xung không

gian có s chiu thp hn (dùng PCA xây dng) và lng t hóa thành mt tp các mu có gii hn, và thng kê mi vùng ã c chiu, các thng kê này c c lng t các mu c chiu xung không gian có s chiu nh hn, mã hóa din mo cc b. Khi t l kh nng ln hn t l ca các xác sut u tiên thì có khuôn mt ngi. Ông cng cho thy so sánh gia phng pháp này và [48], hng tip cn này cho phép xác nh các khuôn mt b xoay và nhìn nghiêng. Schneiderman và Kanade sau ó kt hp bin i wavelet xác nh các khuôn mt nhìn nghiêng và xe hi [58]. Rickert cng dùng cách chn các c trng cc b [229]. Các c trng cc b c trích ra bng cách áp dng các b lc a t l và nhiu phân gii trên d liu nh a vào. Dùng phng pháp gom nhóm d liu và mt Gauss hn hp tìm phân b ca các vector c trng. Sau khi hun luyn cho mô hình và tinh ch, tính kh nng ca các vector c trng ca các nh phân loi. Phng pháp này cho kt qu tt cho xác nh khuôn mt ngi cng nh xe hi. Thang [77] xác nh khuôn mt ngi thông qua phân loi mng Bayes kt hp, hay còn gi là mng Bayes có cu trúc nh rng (Forest-Structured Bayesian Network), xác nh các bit s. Kt hp phng pháp Bagging xây dng phân loi tích hp nhm xác nh khuôn mt ngi trong nh xám. T l chính xác hn 90%. Nam và Rhee [110, 123] xây dng mng Bayes hc phân loi theo ng cnh: màu da, ánh sáng, và kt cu khuôn mt và kt hp mng FuzzyART xác nh khuôn mt ngi trong nh. Hai tác gi này cng dùng thêm khong cách Mahalanobis [122] khi kt hp mng RBF và FuzzyART xác nh khuôn mt có nhiu t l khác nhau. Hai tác gi phát trin bng cách dùng nhiu phân loi Bayes chn ng viên thông qua các c trng thông tin v cng và kt cu ca khuôn mt [126]. T l chính xác hn 87%. Lee và Kim [120] dùng c trng Haar wavelet 1-chiu hun luyn cho mng Bayes xác nh nhiu khuôn mt chp thng trong nh xám thông qua PDF ca các mu khuônmt ngi và mu

18

không phi khuôn mt ngi. T l chính xác là 98%. Zhu [97] dùng wavelet trích các tham s c trng da vào histogram ri dùng mng Bayes ã c hc xác nh khuôn mt ngi trong nhiu t l khác nhau. Duy Nguyen [280] dùng b lc Sobel xác nh các c trng ri dùng phân loi naive Bayes nh Schneiderman và Kanade xác nh khuôn mt ngi. g) Mô hình Markov n Mt gi thuyt quan trng ca mô hình Markov n (Hidden Markov Model ­ HMM) là các mu có th c c tính hóa nh các tin trình ngu nhiên có tham s và các tham s này c c lng chính xác, ây là mt trong nhng nh ngha rõ ràng. Khi phát trin HMM gii quyt bài toán nhn dng mu, phi xác nh rõ có bao nhiêu trng thái n u tiên cho hình thái mô hình. Sau ó, hun luyn HMM hc xác sut chuyn tip gia các trng thái t các mu, mà mi mu c mô t nh mt chui các quan sát. Mc tiêu hun luyn HMM là cc i hóa xác sut ca quan sát t d liu hun luyn bng cách iu chnh các tham s trong mô hình HMM thông qua phng pháp phân on Viterbi chun và các thut toán Baum-Welch [227]. Sau khi hun luyn xong, da vào xác sut xác nh mt quan sát thuôc lp nào. Mt cách trc quan, có th chia mt mu khuôn mt ngi thành nhiu vùng khác nhau nh u, mt, mi, ming, và cm. Có th nhn dng mt mu khuôn mt ngi bng mt tin trình xem xét các vùng quan sát theo mt th t thích hp (t trên xung di, t trái qua phi). Thay vì tin tng vào mc chính xác v trí l dùng cho các phng pháp da trên so khp hay da trên din mo (ni xut hin các c trng nh mt và mi cn xác nh v trí l tt ly c toàn b chi tit ca c trng). Mc tiêu ca hng tip cn này là kt hp các vùng c trng khuôn mt vi các trng thái ca mô hình. Thng các phng pháp da vào HMM s xem xét mt mu khuôn mt nh mt chui các vector quan sát, vi mi vector là mt dãy các im nh, hình 12a và hình 13. Trong quá trình hun luyn và kim tra, mt nh c quét theo mt th

t và mt quan sát c xem nh mt khi các im nh, hình 12a và hình 13. Áp dng mt nh hng theo xác sut chuyn t trng thái này sang trng thái khác, hình 12b, d liu nh c mô hình hóa bng phânb Gauss nhiu bin. Mt chui quan sát bao gm tt c giá tr cng t mi khi. Kt qu xut ra cho bit quan sát thuc lp nào. HMM c dùng nhn dng khuôn mt ngi và xác nh khuôn mt ngi. Samaria [235] dùng nm trng thái tng ng nm vùng, hình 12b mô hình hóa tin trình xác nh khuôn mt ngi. Ông hun luyn tng vùng cho HMM. Mi tình trng s ph trách xem xét vùng tng ng a ra quyt nh phù hp. Nu kt qu xem xét cui cùng vt qua mt ngng thì quan sát này s là khuôn mt ngi.

Hình 12: Mô hình Markov n: (a) các vector quan sát hun luyn cho HMM; (b) nm trng thái n.

Samaria và Young dùng HMM 1-chiu (hình 12) và 2-chiu (hình 13) trích c trng khuôn mt dùng nhn dng khuôn mt [234, 235]. HMM khai thác cu trúc ca khuôn mt tuân theo các chuyn tip trng thái. T các cùng có c trng quan trng nh: tóc, trán, mt, mi, và ming, hai ông phân tích theo t nhiên t trên xung di, mi vùng c thit k thành mt trng thái 1-chiu. Mi nh c phân on chun thành nm vùng theo th t t trên xung di to thành nm trng thái. Hai ông dùng phân on Viterbi thay cho phân on chun và các tham s trong HMM c tái c lng bng thut toán Baum-Welch. Tng t [234], Nefian và Hayes dùng HMM và bin i Karhunen Lòeve (Karhunen Lòeve Tranform ­ KLT) xác nh khuôn mt ngi và nhn dng [217]. Thay vì dùng các giá tr cng thô, các vector quan sát s bao gm các h s (dùng KLT có) thì kt qu s tt hn [234], và t l chính xác khi dùng HMM 2-chiu (hình 13) là 90%.

19

Hình 13: Xác nh khuôn mt bng HMM các trng thái, mi trng thái li có nhng trng thái nh bên trong: trng thái trán có ba trng thái nh bên trong; trng thái mt có nm trng thái nh bên trong.

Rajagopalan a ra hai phng pháp xác sut xác nh khuôn mt ngi [228]. Tng phn vi [248], dùng mt tp các Gauss nhiu bin mô hình hóa phân b ca khuôn mt ngi, phong pháp u tiên trong [228] dùng htng kê có th t mc cao hn (Higher Order Statistic - HOS) c lng cng . Tng t [248], các phân b không bit ca khuôn mt và không phi không mt c gom nhóm bng sáu hàm cng da trên HOS ca các mu. Nh trong [246], s dng tri giác nhiu tng phân loi, mt vector a vào x lý gm mi hai o lng khong cách gia mu nh và mi hai nhóm. Tip cn này da trên c s sinh mt dãy quan sát t nh ri dùnh HMM hc các tham s tng ng. Kt qu ca ông cho thy c hai phng pháp HOS và HMM u có kt qu xác nh khuôn mt ngi cao hn [48, 248], nhng nhiu xác nh nhm hn. Filareti dùng c trng sc màu kt hp thông tin v sâu ca nh làm d liu u vào dy cho HMM xác nh khuôn mt ngi [63]. Phng pháp này cho phép gii quyt vn v iu kin hình nn, sáng, che khut, t th khuôn mt. Hong [121] xây dng mô hình Markov n hc d liu da trên các c trng Haar-like xác nh khuôn mt ngi. T l chính xác là 96%. h) Hng tip cn lý thuyt thông tin Thuc tính trong không gian ca mu khuôn mt có th c mô hình hóa qua nhiu din mo khác nhau. Dùng ng cnh phân on là mt phng pháp hiu qu, xác nh ng cnh thông qua các im nh lân cn. Lý thuyt trng ngu nhiên Markov (Markov Random Field ­ MRF) cung cp mt tin li và cách phù hp mô hình hóa các thc th da vào ng cnh nh các im nh và các c trng có mi tng quan. Theo nh lý 20

Hammersley-Clifford, mt MRF có th c c tính hóa tng ng bng mt phân b Gibbs và các tham s thng cc i hóa sau khi c lng [225]. Nh mt s la chn, các phân khuôn mt ngi và không phi khuôn mt có th c c lng qua các histogram. Dùng thông tin quan h Kullback, tin trình Markov cc i hóa bit s trên c s thông tin gia các lp xác nh khuôn mt ngi [160, 207]. Lew áp dng thông tin quan h Kullback [162] kt hp hàm xác sut p(x) khi mu là khuôn mt ngi và q(x) khi mu không phi là khuôn mt ngi xác nh khuôn mt ngi [207]. Ông dùng 100 cá th khuôn mt ngi gm chin quang cnh c lng phân b ca khuôn mt. Dùng 143,000 mu không phi khuôn mt c lng hàm mt xác sut (PDF) thông qua histogram. T ây chn c các im nh giàu thông tin nht (Most Informative Pixel ­ MIP) cc i hóa thông tin quan h Kullback gia p(x) và q(x) (có c mt phân tách lp cc i). Phân b MIP tp trung các vùng mt và ming, nhng b qua vùng mi. MIP c dùng có c các c trng tuyn tính dùng cho phân loi và mô t bng phng pháp ca Fukunage và Koontz [175]. Dùng mt ca s duyt trên tòan b nh xây dng khong cách t không gian khuôn mt (Distance From Face Space ­ DFFS), c nh ngha [283]. Nu DFFS n không gian con khuôn mt ngn hn khong cách n không gian con không phi khuôn mt, hình 8, thì xem nh ã xác nh c khuôn mt trong ca s. Thông tin quan h Kullback cng c Colmenarez và Huang dùng cc i hóa bit s trên c s thông tin gia các mu negative và positive ca khuôn mt [160]. Phân tích các nh t tp hun luyn ca mi lp (lp khuôn mt ngi và lp không phi khuôn mt ngi) nh các quan sát trong tin trình ngu nhiên và ac c tính hóa bng hai hàm xác sut. Hai ông dùng mt hc các quá trình x lý Markov ri rc mô hình các mu khuôn mt và hình nn ri c lng mô hình xác sut tng ng. Quá trình hc c chuyn thành bài tóan ti u chn c tin trình cc i bit s trên c s thông tin gia hai lp. Tính t l kh

nng dùng cho mô hình xác sut ã c hun luyn ri dùng xác nh khuôn mt ngi. Qian và Hang [225] trình bày mt phng pháp dùng c hai phng pháp trên c s quang cnh và mô hình hóa. u tiên, mt thut toán dùng tri thc min mc cao ca nhng gì khi nhìn vào thì quan tâm ngay gim s chiu không gian tìm kim (thay vì tìm trên toàn b không gian c trng, ch cn tìm trên không gian con có nhng c trng quan tâm). Thut toán này chn các vùng trên nh làm mc tiêu khi có din mo quan tâm xut hin bng thut toán xác nh vùng (phng pháp watershed). Dùng các vùng ã c chn xác nh khuôn mt so khp mu và so khp c trng thông qua trng ngu nhiên Markov và cc i c lng sau. Feng và Shi [102] dùng KFD (Kernel Fisher Discriminant) phân tích nh có khuôn mt ngi ri hc các c trng này xác nh khuôn mt ngi. T l chính xác trong nh xám khong 72%. i) Hc theo quy np Các thut toán hc theo quy np c áp dng xác nh khuôn mt ngi. Huang dùng thut toán C4.5 [226] xây dng cây quyt nh t các mu khuôn mt ngi [187]. Mi mu hun luyn là mt ca s có kích thc 8x8 im nh và c mô t nh mt vector có 30 thuc tính v entropy, trung bình, và lch chun ca các giá tr cng ca im nh. Mi node ca cây quyt nh s ch rõ quyt nh trên mt thuc tính n. T l chính xác khi xác nh khuôn mt c chp thng là 96%. Duta và Jain [273] mô t mt phng pháp hc khái nim khuôn mt ngi bng thut toán Find-S ca Mitchell [215]. Tng t [248], hai ông c oán phân b ca các mu khuôn mt ngi bng p(x | khuoâ maë thông qua mt tp các nhóm theo n t) Gauss và khong cách t mu khuôn mt n tâm nhóm nên nh hn khang cách ln nht t các im n tâm nhóm (ngha là name trong phn bao ca nhóm). Sau ó dùng thut toán Find-S hc khong cách ngng. Phng pháp này có vài c tính riêng. Th nht, không dùng các mu không phi là khuôn mt ngi, trong khi [48, 248] dùng c hai loi mu. Th hai, ch dùng duy nht phn tâm hun luyn. Th ba, các vector c trng gm có các

nh vi 32 mc cng hac kt cu, trong khi [248] dùng toàn b t l các giá tr cng . T l chính xác là 90%. Bernhard Froba và Andreas Ernts [25] dùng cây quyt nh có nhiu nhánh cho phép xác nh khuôn mt ngi nhìn nghiêng t -60o n 60o, mi node có kh nng loi b ca s con hin hành ang xét hoc phân loi vào mt trong ba lp quay. T l chính xác cho nh xám là 90%. Socolinsky [91] dùng phân loi CCCD (ClassCover Catch Digraph) kt hp boosted tree-like thông qua o cross-correlation xác nh khuôn mt ngi da trên tp mu hun luyn. Ramana [112] dùng cây quyt nh nh mt công c phân loi xem phn nào s là khuôn mt ngi. Trong khi xây dng cây ông kt hp c cascade tng tính hiu qu. j) AdaBoost Hc vi AdaBoost là mt phân loi mnh phi tuyn phc HM(x), c xây dng t M phân loi yu [274], H M ( x) =

M

m=1

mhm ( x) m=1 m

M

vi x là mu cn

phân loi, hm(x){-1,1} là M phân loi yu, m0 là các h s trong , và

M

m=1

m là nhân t

chun hóa. Mc tiêu ca Adaboost là hc mt dãy các phân loi yu. Gi s có mt tp N mu hun luyn ã c gán nhãn {(x1,y1), ..., (xN,yN)}, vi yi là nhãn tng ng ca mu xi

n

. Tính mt phân

b ca các mu hun luyn [w1, ..., wN] cp nht trong sut quá trình hc. Sau bc lp m, mu khó phân loi (xi,yi) có trng mi wi(m), n bc lp th (m+1), mu này s có tm quan trng hn. Viola và Jones dùng AdaBoost kt hp cascade xác nh khuôn mt ngi [52] vi các c trng dng Haar wavelet-like [221, 275]. Tc x lý khá nhanh và t l chính xác hn 80% trên nh xám. Schneiderman và Kanade dùng wavelet trích c trng ri xây dng h thng hc vi Adaboost, da trên xác sut và histogram xác nh khuôn mt ngi [26]. T l chính xác trên 90%. Chen [37] c lng tham s ánh iu chnh ánh sáng cho phù hp cho các mu bng SVM. Sau

21

cùng dùng Adaboost xác nh khuôn mt ngi vi t th chp thng. T l chính xác là 89.7%. Lu [58] dùng phân tích bit s tuyn tính (Linear Discriminant Analysis ­ LDA) trích c trng. Sau ó hun luyn b phân loi yu boosting phân loi khuôn mt ngi. Shinji và Osamu [137] xây dng các trng ca khuôn mt bng cách s dng nhiu mc phân gii thp xác nh khuôn mt ngi thông qua Adaboost. Jin [113] ch ra nu dùng tng phng pháp so khp mu hay cascade riêng r thì mc chính xác gn nh nhau, nhng mc xác nh sai khá cao. Tác gi kt hp hai phng pháp này gim t l sai ca phng pháp xác nh khuôn mt ngi. Ou [115] thy rng khi dùng cascade AdaBoost xác nh khuôn mt ngi thì thng thng dùng thut toán greedy tìm các trng ca b phân loi yu thì không uc ti u. Tác gi xut dùng GA thay th cách tìm trên nhm tng tính hiu qu. k) Các c trng Haar-like và phân loi vi cascade Viola và Jones dùng bn loi c trng Haarlike c bn xác nh khuôn mt ngi [52, 221], hình 13. c trng Haar c a thích vì có hai lý do: (1) phân loi mnh trong vic xác nh khuôn mt ngi hay không phi khuôn mt ngi; và (2) có hiu qu [276] khi dùng bng tng các vùng [284] hoc k thut nh y [52].

gim t l sai. Cui cùng dùng cascade x lý khut. Maeynet và Thiran [62] xác nh c trng Gauss không ng hng và Haar-like kt hp Adaboost xác nh khuôn mt ngi. Tng t Song [99] cng dùng AdaBoost xác nh khuôn mt ngi kt hp màu da ngi. Ri dùng các thông tin này theo vt các i tng là con ngi trong phòng. Ishii [64] xây dng phng pháp BDF (Block Difference Feature) vi các c trng Haar-like xác nh các t th ca khuôn mt, ri dùng kt qu này so sánh vi d liu ã c hc trc ó và xác nh có khuôn mt hay không trong nh. l) Hc vi FloatBoost Li và Zhang a ra mt khái nim mi ó là FloatBoost [103]. Phng pháp này hc da trên phân loi boosting t l li cc tiu. Nhng phng pháp này cho phép quay lui sau khi ti mi bc khi hc bng AdaBoost ã cc tiu c t l li trc tip, cc tiu theo hàm m. Có hai vn gp khi dùng phng pháp AdaBoost: o Th nht: AdaBoost cc tiu theo hàm m ti biên qua tp hun luyn. ây là tiên li, tuy nhiên mc tiêu cui cùng trong các ng dng dùng phân loi mu thì thng là cc tiu mt giá tr trc tip (tuyn tính) kt hp vi t l li. Mt phân lai mnh c hc bng AdaBoost thì gn im ti u ca ng dng trong iu kin t l li. Vn này không thy tài liu nói n có li gii. o Th hai: AdaBoost li mt thách thc nu dùng phân lai yu hc. Hc phân loi ti u khi dùng phân loi yu cn c lng mt không gian c trng, iu này là vn khó, c bit khi s chiu ca không gian khá ln. Mt thut toán hc yu có hiu qu và d dùng thì rt cn thit. FloatBoost xem nh mt cu ni gia mc tiêu ca hc boosting thông thng (cc i biên) và nhiu ng dng dùng cc tiu t l li thông qua vic kt hp phng pháp tìm kim Floating và AdaBoost kt hp k thut quay lui. Tian [101] xây dng cây xác nh trên c s hc tích cc bng thut toán gom nhóm c-mean m da

Hình 13: Bn loi c trng Haar wavelet-like.

nh y II(x,y) ti v trí (x,y) là tng các im nh trên và bên trái ca (x,y) [52],

II ( x, y) =

x ' x , y ' y

I ( x, y)

Lienhart phát trin các c trng Haar-like thành mt b c trng mi [19] kt hp phân loi cascade xác nh khuôn mt ngi. Lin [79] dùng boost loi trng hp hc quá khp ng thi s dng hun luyn tng cng

22

trên nn tng FloatBoost. Tác gi dùng các c trng Harr wavelet-like áp dng cho phng pháp ca mình. Phng pháp này cho phép xác nh nhiu khuôn mt ngi nhiu t th khác nhau trong nh màu.

Hình 15: Mt ví d v cú pháp nh.

m) Phân loi da trên cú pháp hay mnh Tu [141] da trên khái nim cú pháp trong x lý ngôn ng xây dng th cú pháp ca nh da trên ni dung nh, hình 15, vi chui Markov. Sau khi có c các t vng, ông dùng phng pháp Adaboost ã c hun luyn trc ó xác nh các i tng. Hoc có th xem tng vùng ca khuôn mt ngi nh các phn cu thành mt khuôn mt, ri xây dng các gi thuyt xác nh khuôn mt ngi. Bastian [278] ã xây dng mt lý thuyt tng quát cho các loi i tng. n) Phân loi da trên loi b Elad xây dng mt phân loi da trên khái nim loi b ti a (Maximal Rejection Classifier ­ MRC) khác hn ý tng phân loi khác. Các phng pháp khác tìm mc chung ca mt các th nào ó so vi các lp chn cá th ó vào lp nào. Ông chn cách loi b nhng lp mà cá th này không có hoc có ít mi tng quan, chi phí loi b không cao lm [28]. Ông tính PDF ca hai lp: khuôn mt ngi và không phi khuôn mt ngi. Ông xem khuôn mt ngi là target và khôn phi khuôn mt ngi là clutter. Ông tìm ngng loi b theo xác sut thông qua bit s tuyn tính Fisher (FLD). Ông chiu d liu xung mt vector chiu, thông qua phép chiu này xác nh khuônmt ngi.

o) Hng tip cn tng hp Các các phng pháp c chia làm bn phân loi chính theo bn hng tip cn. Tuy nhiên, có nhiu phng pháp không hoàn toàn ri vào mt trong bn hng tip cn này mà trong nhiu hng tip cn khác nhau. Ví d, phng pháp so khp mu dùng mô hình khuôn mt ngi và các mu con trích các c trng khuôn mt [163, 177, 232, 238, 269], và sau ó dùng các c trng này xác nh khuôn mt. Hn na phng pháp da trên tri thc và phng pháp so khp mu không tht s tách bit, t ó có nhiu hng gii quyt dùng tri thc ca con ngi nh ngha các mu khuôn mt ngi [164, 232, 238]. Kim [24] kt hp các c trng láng ging ca khuôn mt xây dng các mu theo các hng, sau ó dùng k thut xác nh cnh EBM (Edge-like Blob Map) theo cng . Ông xây dng logic m kt hp PCA c lng t th các khuôn mt. Taur và Tao [68] xây dng phân loi neurofuzzy (neuro-fuzzy classifier ­ NEFCAR) có o tin cy bit nh nào là khuôn mt ngi. Các ng viên c chn thông qua phân an màu da. Chen s dng MRF kt hp hình thái hc xác nh khuôn mt ngi [87]. Ông dùng các b lc top-hat, bottom-hat, và watershed phân on nh i tng ang di chuyn nhm tìm ng viên khuôn mt. Sau cùng dùng MRF và hình dng ellipse ca khuôn mt xác nh ng viên nào là khuôn mt. Garcia và Tziritas [2, 11] sau khi lc nhng vùng nào có màu là màu da ngi tìm ng viên, sau ó dùng thut toán trn vùng to ng viên mn hn. Hai ông dùng phân tích theo wavelet phân rã ng viên xem có cùng kt cu vi khuôn mt ngi hay không thông qua khong cách Bhattacharrya. T l chính xác khong 95%. Cooray và Connor [3] và Lee [36] dùng k thut lai trên c s trích c trng và PCA xác nh khuôn mt ngi. Hai ông dùng các c trng v màu sc ca mt và ming xác nh các vùng này. T nay áp dng lý thuyt eigenface chun hóa không gian tìm kim, ng thi dùng khong cách gia hai mt có kt qu cui cùng. Zhang [41] kt hp mô hình màu da ngi phân on tìm ng viên khuôn mt. Ông xây dng mng neural nh ca Rowley [49] quay khuôn 23

mt sau ó so khp các mu có sn. Phng pháp này cho xác nh các khuôn mt các t th khác nhau trong nh màu, thi gian x lý s gim hn vì không gian tìm kim ã b thu hp. Tng t Haizhou [40] cng dùng phng pháp nh th nhng thay i quá trình xác nh. Ông so khp mu dùng tìm ng viên. Sau ó dùng mng neural phân lai ng viên nào là khuôn mt ngi. Li [138] dùng kernel hc nh là mt ánh x phi tuyn, u tiên ông dùng KPCA (Kernel PCA) chn các c trng và không gian c trng hc. Sau ó ông dùng KSVC (Kernel Support Vector Classifier) kt hp FLD phân loi âu là khuôn mt ngi. Yin và Meng [107] dùng phân on nh tính cht màu da ngi, t ây tác gi tìm c v trí ca mt theo tiêu chun mc cân i xem các vùng này là các ng ng ca khuôn mt. T các ng viên này, tác gi so khp vi các mu có sn xác nh ng viên nào là khuôn mt ngi. T l chính xác là 85%. Lingmin [93] và Emanuele [142] dùng lý thuyt hc theo xác sut xây dng mô hình xác nh khuôn mt ngi. Trong khi Emanuele dùng c trng Haar wavelet xác nh c trng ri dy cho SVM phân loi. Lingmin dùng ba lp: tng cui dùng mi tng quan hình hc các mu, tng gia xét tính a dng ca các thành phn khuôn mt ngi vi HMM, và tng trên cùng dùng mô hình th cho quan h ba thành phn to thành mt hình tam giác (xét tính can i). III. KHÓ KHN VÀ THÁCH THC TRONG BÀI TOÁN XÁC NH KHUÔN MT NGI Vic xác nh khuôn mt ngi có nhng khó khn nht nh [57] nh sau, hình 16: o Hng (pose) ca khuôn mt i vi máy nh, nh: nhìn thng, nhìn nghiêng hay nhìn t trên xung. Cùng trong mt nh có th có nhiu khuôn mt nhng t th khác nhau. o S có mt ca các chi tit không phi là c trng riêng ca khuôn mt ngi, nh: râu quai nón, mt kính, .... o Các nét mt (facial expression) khác nhau trên khuôn mt, nh: vui, bun, ngc nhiên, .... o Mt ngi b che khut bi các i tng khác có trong nh.

o o o o o o

iu kin nh, c bit là v sáng và cht lng nh, cht lng thit b thu hình. Trc to ca máy nh so vi nh. Kích thc khác nhau ca các khuôn mt ngi, và c bit là trong cùng mt nh. Màu sc ca môi trng xung quanh, hay màu sc qun áo ca ngi c chp ly nh. Xut hin thành phn khuôn mt hay không. Nhiu khuôn mt có vùng da dính ln nhau.

Các khó khn trên chng t rng bt c phng pháp gii quyt (thut tóan) bài tóan xác nh khuôn mt ngi s không th tránh khi mt s khim khuyt nht nh. ánh giá và so sánh các phng pháp xác nh mt ngi, ngi ta thng da trên các tiêu chí sau: o T l xác nh chính xác là t l s lng các khuôn mt ngi c xác nh úng t h thng khi s dng mt phng pháp xây dng so vi s lng khuôn mt ngi tht s có trong các nh (detection rate). o S lng xác nh nhm là s lng vùng trong nh không phi là khuôn mt ngi mà h thng xác nh nhm là khuôn mt ngi (false positives). o Thi gian thc hin là thi gian máy tính xác nh khuôn mt ngi trong nh (running time). IV. KT LUN Bài vit này c gng cung cp mt cái nhìn tng quan các phng pháp xác nh khuôn mt ngi và mt cách phân loi các hng tip cn t nh xám n nh màu da vào gn 300 bài báo, báo cáo ca các phòng nghiên cu, và lun vn trên th gii. Xác nh khuôn mt ngi trong nh là mt bài toán hp dn, ã thách thc nhiu ngi nghiên cu vì tính ng dng to ln trong thc t. Hy vng vi bài vit này s giúp nhiu ngi có c nhng kin thc nht nh, giúp nhiu ngi không phi mt nhiu thi gian khi bt u nghiên cu bài toán hp dn này, cùng nhau vn ra bin khi tri thc ca th gii.

24

(a)

(b)

(c)

(d)

(e)

(e) (f) Hình 16: Các khó khn ca vic xác nh mt ngi:

(a) hng mt nghiêng; (b) mt kính en và nón; (c) nh b chói bi èn; (d) máy nh t phía trên và sau lng ngi b chp; (e) vùng da các khuôn mt dính nhau; (f) màu môi trng xung quanh gn vi màu da ngi; (g) cht lng nh kém.

TÀI LIU THAM KHO

[1] Rein-Lien Hsu, Mohamed abdel-Mottaleb, and Anil K. Jain, "Face Detection in Color Images", IEEE Transaction on Pattern Analysis and Machine Intelligent, vol. 24, no. 5, pp. 696-706, 2002. [2] C. Garcia, G. Zikos, and G. Tziritas, "Face Detection in Color Images using Wavete Packet Analysis", Proc. of IEEE International Conference on Multimedia Computing and System, vol. 1, pp. 703708, IEEE, 1999. [3] Saman Cooray and Noel O'Connor, "Facial Feature Extraction and Principal Component Analysis for Face Detection in Color Image", ICIAR 2004, LNCS 3212, pp. 741-749, Springer-Verlag Berlin Heidelberg, 2004. [4] Satyanadh, Li Tao, and Vijayan Asari, "Face Detection Technique Based on Intesity and Skin Color Distribution", International Conference on Image Processing, IEEE, 2004. [5] Rainer Stiefelhagen, Jie Yang, and Alex Waibel, "Tracking Eyes and monitoring Eye Gaze", Proceedings of the Workshop on Perceptual User Interfaces (PUI'97), Alberta, Canada. pp. 98-100, 1997. [6] Carlos Morimoto, Dave Koons, Amon Amir, and Myron Flickner, "Real-Time Detection of Eyes and Faces", In Proc. Workshop on Perceptual User Interfaces, pp. 117-120, 1998.

[7] Eun Yi Kim, Sin Kuk Kang, Keechul Jung, and Hang Joon Kim, "Eye Mouse: Mouse Implementation using Eye Tracking", IEEE, 2005. [8] Hichem Sabbi and Nozha Boujemaa, "Coarse to Fine Face Detection Based on Skin Color Adaption", Biometric Authentication, LNCS 2359, pp. 112-120, Springer-Verlag Berlin Heidelberg, 2002. [9] Ming-Hsuan Yang, David J. Kriegman, and Narendra Ahuja, "Detecting Faces in Images: A Survey", IEEE Transaction on Pattern Analysis and Machine Intelligent, vol. 24, no. 1, 2002. [10] Douglas Chai and King N. Ngan, "Face Segmentation Using Skin-Color map in Videophone Applications", IEEE Transaction on Circuits and Systems for Video Technology, vol. 9, no. 4, 1999. [11] Christophe Garcia and Georgios T zirita, "Face Detection Using Quantized Skin Color Region Merging and Wavelet Packet Analysis", IEEE Transaction on Multimedia, vol. 1, no. 3, 1999. [12] Mark Everingham and Andrew Zisserman, "Automated Person Identification in Video", CIVR 2004, LNCS 3115, pp. 289-298, Springer-Verlag Berlin Heidelberg, 2004. [13] Fuzhen Huang and Jianbo Su, "Multiple Face Contour Detection Using adaptive Flows", Sinobiometrics 2004, LNCS 3338, pp. 137-143, Springer-Verlag Berlin Heidelberg, 2004. [14] Seonghoon Kang and Seong-Whan Lee, "Object Detection and Classification for Outdoor Walking Guidance System", BMCV 2002, LNCS 2525, pp. 601-610, Springer-Verlag Berlin Heidelberg, 2002. [15] Shihong Lao and Masato Kawade, "Vision-Based Face Understanding Technologies and Their Application", Sinobiometric 2004, LNCS 3338, pp. 339-348, Springer-Verlag Berlin Heidelberg, 2004. [16] Stephen C. Y. Chan and Paul H. Lewis, "A Pre-filter Enabling Fast Frontal Face Detection", Visual'99, LNCS 1614, pp. 777-785, Springer-Verlag Berlin Heidelberg, 1999. [17] Klaus J. Kirehberg, Oliver Jeorsky and Robert W. Frischholz, "Genetic Model Optimization for Hausdorff Distance-Based Face Localization", Biometric Authentication, LNCS 2359, pp. 103-111, Springer-Verlag Berlin Heidelberg, 2002. [18] Stanley M. Bileschi and Bernd Heisele, "Advances in Component-Based Face Detection", SVM 2002, LNCS 2388, pp. 135-143, Springer-Verlag Berlin Heidelberg, 2002. [19] Rainer Lienhart, Alexander Kuranov, and Vadim Pisarevsky, "Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection", DAGM 2003, LNCS 2781, pp. 297-304, Springer-Verlag Berlin Heidelberg, 2003. [20] Jean-Christophe Terrillon, Mahdad N. Shirazi, Daniel McReynolds, Mohamed Sadek, Yunlong Sheng, Shigeru Akamatsu, and Kazuhiko Yamamoto, "Invariant Face Detection in Color Image Using Orthogonal Fourier-Mellin Moments and Support Vector Machines", ICAPR 2001, LNCS

25

2013, pp. 83-92, Springer-Verlag Berlin Heidelberg, 2001. [21] Hannes Kruppa, Martin A. Bauer, and Bernt Schiele, "Skin Patch Detection in Real-World Images", DAGM 2002, LNCS 2449, pp. 109-116, SpringerVerlag Berlin Heidelberg, 2002. [22] Jia Kui and Liyanage C. De Silva, "Combined Face Detection/Recognition System for Smart Rooms", AVBPA 2003, LNCS 2688, pp. 787-795, SpringerVerlag Berlin Heidelberg, 2003. [23] Jin Ok Kim, Sung Jin Seo, Chin Hyun Chung, Jun Hwang, and Woonglae Lee, "Face Detection by Facial Features with Color Images and Face Recognition Using PCA", ICCSA 2004, LNCS 3043, pp. 1-8, Springer-Verlag Berlin Heidelberg, 2004. [24] YoungOul Kim, SungHo Jang, SangJin Kim, changWoo Park, and Joonki Paik, "Pose-Invariant Face Detection Using Edge-Like Blob Map and Fuzzy Logic", IEA/AIE 2005, LNCS 3533, pp. 695-704, Springer-Verlag Berlin Heidelberg, 2005. [25] Bernhard Froba and Walter Zink, "On the Combination of Different Template Matching Stategies for Fast Face Detection", MCS 2001, LNCS 2096, pp. 418-428, Springer-Verlag Berlin Heidelberg, 2001. [26] Henry Schneiderman, "Statistical Approach to 3D Object Detection ­ Applied to Faces and Cars", Ph.D. Thesis, Carnegie Mellon University, 2000. [27] Kang Ryoung Park, "Gaze Detection System by Wide and Auto Pan/Tilt Narrow View Camera", DAGM 2003, LNCS 2781, pp. 76-83, SpringerVerlag Berlin Heidelberg, 2003. [28] Michael Elad, Yacov Hel-Or, and Renato Keshet, "Pattern Detection Using Maximal Rejection Classifier", LNCS 2059, Springer-Verlag Berlin Heidelberg, 2001. [29] Gil Friedrich and Yehezkel Yeshurun, "Seeing People in the Dark: Face Recognition in Infrared Images", BMCV 2002, LNCS 2525, pp. 348-359, Springer-Verlag Berlin Heidelberg, 2002. [30] Hong-Mo Je, Daijin Kim, and Sung Yang Bang, "Human Face Detection in Digital Video Using SVM Ensemble", Neural Processing Letter 17:239252, Kluwer Academic Publishers, Netherlands, 2003. [31] Jongmoo Choi, Sanghoon Lee, Chilgee Lee, and Juneho Yi, "PrimeEye: A Real-Time Face Detection and Recognition System Robust to Illumination Changes", AVBPA 2001, LNCS 2091, pp. 360-365, Springer-Verlag Berlin Heidelberg, 2001. [32] A Jonathan Howell and Hilary Buxton, "Visual Mediated Interaction Using Learnt Gestures and Camera Control", GW 2001, LNAI 2298, pp. 272284, Springer-Verlag Berlin Heidelberg, 2002. [33] Daniel Keren, Margarita Osadchy, and Craig Gotsman, "Antifaces: A Novel, Fast Method for Image Detection", IEEE Transaction on Pattern

Analysis and Machine Intelligence, vol. 23, no. 7, IEEE, 2001. [34] Gines Garcia Mateos and Cristina Vicente Chicote, "Face Detection on Still Images Using HIT Maps", AVBPA 2001, LNCS 2091, pp. 102-107, SpringerVerlag Berlin Heidelberg, 2001. [35] M. Castrillon Santana, J. Lorenzo Navarro, J. Cabrera Gamez, F. M. Hernandez Tejera, and J. Mendez Rodriguez, "Detection of Frontal Faces in Video Streams", Biometric Authentication, LNCS 2359, pp. 91-102, Springer-Verlag Berlin Heidelberg, 2002. [36] Chang-Woo Lee, Yeon-Chul Lee, Sang-Yong Bak, and Hang-Joon Kim, "Real-Time Face Detection and Tracking Using PCA and NN", PRICAI 2002, LNAI 2417, pp. 615, Springer-Verlag Berlin Heidelberg, 2002. [37] Jie Chen, Yuemin Li, Laiyun Qing, Baocai Yin, and Wen Gao, "Face Samples Re-lighting for Detection Based on the Harmonic Images", PCM 2004, LNCS 3332, pp. 585-592, Springer-Verlag Berlin Heidelberg, 2004. [38] Hazem El-Bakry, "A Rotation Invariant Algorithm for Recognition", Fuzzy day 2001, LNCS 2206, pp. 284-290, Springer-Verlag Berlin Heidelberg, 2001. [39] Kenji Iwata, Hitoshi Hongo, Kazuhiko Yamamoto, and Yoshinori Niwa, "Robust Facial Parts Detection by Using Four Directional Features and Relaxation Matching", KES 2003, LNAI 2774, pp. 882-888, Springer-Verlag Berlin Heidelberg, 2003. [40] Ai Haizhou, Liang Luhong, and Xu Guangyou, "A General Framework for Face Detection", ICMI 2000, LNCS 1948, pp. 119-126, Springer-Verlag Berlin Heidelberg, 2000. [41] Hongmin Zhang, Debin Zhao, Wen Gao, and Xilin Chen, "Combining Skin Color Model and Neural Network for Rotation Invariant Face Detection", ICMI 2000, LNCS 1948, pp. 237-244, SpringerVerlag Berlin Heidelberg, 2000. [42] Rob McCready, "Real-Time Face Detection on a Configurable Hardware System", FPL 2000, LNCS 1896, pp. 157-162, Springer-Verlag Berlin Heidelberg, 2000. [43] J. Fritsch, S. Lang, M. Kleinehagenbrock, G. A. Fink, and G. Sagerer, "Improving Adaptive Skin Color Segmentation by Incorporating Results from Face Detection", In Proc. IEEE Int. Workshop on Robot and Human Interactive Communication, Germany, IEEE, 2002. [44] Raquel Montes Diez, Cristina Conde, and Enrique Cabello, "Automatic Detection of the Optimal Acceptance Threshold in a Face Verification System", BioAW 2004, LNCS 3087, pp. 70-79, Springer-Verlag Berlin Heidelberg, 2004. [45] Henry Nicponski, "Understanding In-Plane Face Rotations Using Integral Projections", ICIAR 2004, LNCS 3213, pp. 633-642, Springer-Verlag Berlin Heidelberg, 2004.

26

[46] Tony W.H. Ao leong and Raymond S.T. Lee, "iJade Face Recognizer ­ A Multi-agent Based Pose and Scale Invariant Human Face Reconition System", KES 2004, LNAI 3214, pp. 594-601, SpringerVerlag Berlin Heidelberg, 2004. [47] Jin Ok Kim, Jin Soo Kim, and Chin Hyun Chung, "Face Region Dectection on Skin Chrominance from Color Images by Facial Features", ICADL 2004, LNCS 3334, pp. 646, Springer-Verlag Berlin Heidelberg, 2004. [48] Henry A. Rowley, Shumeet Baluja, and Takeo Kanade, "Neural Network-Based Face Detection", IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 20, no. 1, pp. 23-38, IEEE, 1998. [49] Henry A. Rowley, Shumeet Baluja, and Takeo Kanade, "Rotation Invariant Neural Network-Based Face Detection", Proc. IEEE Conf. Computer Vision and Pattern Recognition, pp. 38-44, 1998 [50] Stephanie Jehan-Besson, Michel Barlaud, and Gilles Aubert, "DREAMS: Deformable Region Driven by an Eulerian Accurate Minimization Method for Image and Video Segmentation (Application to Face Detection in Color Video Sequences)", ECCV 2002, LNCS 2352, pp. 365-380, Springer-Verlag Berlin Heidelberg, 2002. [51] Hongming Zhang and Debin Zhao, "Spatial Histogram Features for Face Detection in Color Images", PCM 2004, LNCS 3331, pp. 377-384, Springer-Verlag Berlin Heidelberg, 2004. [52] Paul Viola, "Robust Real-Time Face Detection", International Journal of Computer Vision 57(2), 137154, Kluwer Academic Publishers, Netherlands, 2004. [53] Kim-Fung Jang, Ho-Man Tang, Michael R. Lyu, and Irwin King, "A Face Processing System Based on Committee Machine: The Approach and Experimental Results", CAIP 2003, LNCS 2756, pp. 614-622, Springer-Verlag Berlin Heidelberg, 2003. [54] James W. Davis and Serge Vals, "A Perceptual User Interface for Recognizing Head Gesture Acknoledgements", ACM International Conference Proceeding Series, vol. 15, pp. 1-7, 2001. [55] Chengjun Liu and Harry Wechsler, "Gabor Feature Based Classification Using the Enhanced Fisher Linear Discriminant Model for Face Recognition", IEEE Transactions on Iamge Processing, vol. 11, no. 4, IEEE, 2002. [56] Wenchao Zhang, Shiguang, Wen Gao, Xilin Chen, and Hongming Zhang, "Local Gabor Binary Pattern Histogram Sequence (LGBPHS): A Novel NonStatistical Model for Face Representation and Recognition", Proceedings of the 10th IEEE International Conference on Computer Vision (ICCV'05), IEEE, 2005. [57] Peter N. Belhumeur, "Ongoing Challenges in Face Recognition", Frontiers of Engineering: Reports on Leading-Edge Engineering from the 2005, Symposium (2006).

[58] Juwei Lu, K.N. Plataniotis, A.N. Venetsanopoulos, and Stan Z. Li, "Ensenble-based Discriminant Learning with Boosting For Face Recognition", IEEE Transactions on Neural Networks, vol. 17, pp. 166-178, 2006. [59] Rogerio S. Feris, Jim Gemmell, Kentaro Toyama, and Volker Kruger, "Hierarchical Wavelet Networks for Facial Feature Localization", Proceedings of Fifth IEEE International Conference on Automatic Face and Gesture Recognition, pp. 118-123, 2002. [60] Baochang Zhang, "Gabor-Kernel Fisher Analysis for Face Recognition", LNCS 3332, Springer-Verlag Berlin Heidelberg, 2004. [61] Paola Campadelli, Raffaella Lanzarotti, Chiara Savazzi, "A feature-based face recognition system", Proceedings of 12th International Conference on Image Analysis and Processing, pp. 68-73, IEEE, 2003. [62] Julien Meynet, Vlad Popovici, and Jean-Philippe Thiran, "Face Detection with Mixtures of Boosted Discriminant Features", Technical Report, http://biomed.epfl.ch/index.php?module=people&PE OPLE_MAN_OP=view&PHPWS_MAN_ITEMS% 5B%5D=14&show_publications=1, 2005. [63] Filareti Tsalakanidou, Sotiris Malassiotis, and Michael G. Strintzis, "Face Localization and Authentication Using Color and Depth Images", IEEE Transactions on Image Processing, vol. 14, no. 2, IEEE, 2005. [64] Yasunori Ishii, Kazuyuki Imagawa, Eiji Fukumiya, Katsuhiro Iwasa, Yasunobu Ogura, "Profile Face Detection using Block Difference Feature For Automatic Image Annotation", International Conference on Consumer Electronics ICCE '06. 2006 Digest of Technical Papers, IEEE, 2006. [65] Jong-Bae Kim, Su-Woong Jung, and Hang-Joon Kim, "Face Detection by Integrating Multiresolution-Based Watersheds and Skin-Color Model", IEA/AIE 2002, LNAI 2358, pp. 715-724, Springer-Verlag Berlin Heidelberg, 2002. [66] Gary G. Yen and Nethrie Nithianandan, "Automatic Facial Feature Extraction Using Edge Distribution and Genetic Search", International Journal of Computational Intelligence and Applications, vol. 3, no. 1, pp. 89-100, Imperial College Press, 2003. [67] Hideaki Sato, Katsuhiro Sakamoto, Yasue Mitsukura, and Norio Akamatsu, "Face Edge Detection System by Using the GAs", KES 2004, LNAI 3213, pp. 847-852, Springer-Verlag Berlin Heidelberg, 2004. [68] J.S. Taur and C.W. Tao, "A New Neuro-Fuzzy Classifier with Application to On-Line Face Detection and Recognition", Journal of VLSI Signal Processing 26, 397-409, Kluwer Academic Publishers, the Netherlands, 2000. [69] Sang-Burm Rhee and Young-Hwan Lee, "Improved Face Detection Algorithm in Mobile Enviroment", ICCS 2004, LNCS 3036, pp. 638-686, SpringerVerlag Berlin Heidelberg, 2004.

27

[70] Douglas Chai and Kim N. Ngan, "Locating Facial Region of a Head-and-Shoulders Color Image", Proc. Third Int'l Conf. Automatic Face and Gesture Recognition, pp. 124-129, 1998. [71] Bae-Ho Lee, Kwang-Hee Kim, Yonggwan Won, and Jiseung Nam, "Efficient and Automatic Faces Detection Based on Skin-Tone and Neural Network Model", IEA/AIE 2002, LNAI 2358, pp. 57-66, Springer-Verlag Berlin Heidelberg, 2002. [72] Shu-Fai Wong and Kwan-Yee Keneth Wong, "Fast Face Detection Using QuadTree Based Color Analysis and Support Vector Verification", ICIAR 2004, LNCS 3212, pp. 676-683, Springer-Verlag Berlin Heidelberg, 2004. [73] Henry Schneiderman and Takeo Kanade, "Probabilistic Modeling of Local Appearance and Spatial Relationship for Object Recognition", Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 45-51, IEEE, 1998. [74] Gines Garcia_Mateos, Alberto Ruiz, and Perdo E. Lopez-de-Teruel, "Face Detection Using Integral Projection Models", SSPR&SPR 2002, LNCS 2396, pp. 644-653, Springer-Verlag Berlin Heidelberg, 2002. [75] QingHua Wang, Luis Seabra Lopes, and David M.J. Tax, "Visual object recognition through one-class learning", Image analysis and recognition: international conference ICIAR, vol. 1, pp. 463-470, 2004. [76] Selin Baskan, M. Mete Bulut, Volkan Atalay, "Projection based method for segmentation of human face and its evaluation", Pattern Recognition Letters 23, pp. 1623-1629, Elsevier Science, 2002. [77] Thang V. Pham. Marcel Worring, and Arnold W.M. Smeulders, "Face Detection by Aggregated Bayesian Network Classifiers", MLDM 2001, LNAI 2123, pp. 249-262, Springer-Verlag Berlin Heidelberg, 2001. [78] Shou-Der Wei and Shang-Hong Lai, "An Efficient Algorithm for Detecting Faces from Color Images", PCM 2002, LNCS 2532, pp. 1177-1184, SpringerVerlag Berlin Heidelberg, 2002. [79] Yen-Yu Lin, Tyng-Luh Liu, and Chiou-Shann Fuh, "Fast Object Detection with Occlusions", ECCV 2004, LNCS 3021, pp. 402-413, Springer-Verlag Berlin Heidelberg, 2004. [80] Kyongpil Min, Junchul Chun, and Goorack Prak, "A Nonparametric Skin Color Model for Face Detection from Color Images", PDCAT 2004, LNCS 3320, pp. 116-120, Springer-Verlag Berlin Heidelberg, 2004. [81] Herve Abdi, "A Generalized Approach for Connectionist Auto-Associative Memories: Interpretation, Implication & Illustration for Face Processing", Artificial intelligence and cognitive sciences, Manchester University Press. pp. 149-165, Manchester, 1988. [82] Jianping Fan, David K.Y. Yau, Ahmed K. Elmagarmid, an Walid G. Arref, IEEE Transactions on Image Processing, vol. 10, no. 10, IEEE, 2001.

[83] Jianzhong Fang and Guoping Qiu, "Learning an Information Theoretic Transform for Object Detection", ICAR 2004, LNCS 3211, pp. 503-510, Springer-Verlag Berlin Heidelberg, 2004. [84] T. Darrell, G. Gordon, M. Harville, and J. Woodfill, "Integrated Person Tracking Using Stereo, Color, and pattern Detection", International Journal of Computer Vision 37(2), 175-185, Kluwer Academic Publishers, the Netherlands, 2000.

28

Information

Microsoft Word - tong quan xac dinh khuon mat nguoi Pham the Bao.doc

28 pages

Find more like this

Report File (DMCA)

Our content is added by our users. We aim to remove reported files within 1 working day. Please use this link to notify us:

Report this file as copyright or inappropriate

97884