Seminar Ymchwil – Cyfrifiadura, Dr Phoey Lee Teh

Ddechrau mis Mawrth, cyflwynodd Dr Phoey Lee Teh seminar ymchwil FAST, a gadeiriwyd gan Dr Rob Bolam. 

Soniodd Phoey am ddau bwnc o fewn y maes Cyfrifiadura, gan ddechrau gyda ‘Human Created and AI-Generated Text: What’s Left to Uncover?’. Mae’r pwnc hwn o ddiddordeb mawr i’r gymuned ar hyn o bryd, gan fod yna bryderon ynghylch twyll yn ymwneud â Deallusrwydd Artiffisial (AI) a chamymarfer academaidd. Ond dangosodd Phoey y gall AI weithio er budd pobl trwy ei ddarganfod ei hun, ac o ganlyniad gellir darganfod a oes rhywun wedi’i ddefnyddio ar gyfer twyll neu gamymarfer. 

Cawsom ein cyflwyno gan Phoey i’r cysyniadau Modelau Iaith Mawr (LLM) a dysgu peirianyddol, lle caiff y peiriant ei hyfforddi gan bobl ar sail promptiau a fewnbynnir i’r peiriant. Un enghraifft gyffredin yw ChatGPT, sydd wedi bod o gwmpas ers sawl blwyddyn, ac mae ei fersiwn ddiweddaraf bellach yn becyn y codir tâl amdano. Mae rhai cymunedau ac academyddion wedi croesawu’r defnydd o AI, er enghraifft mewn Addysg, lle gall gyfoethogi dysgu, cynorthwyo dealltwriaeth, a lleihau llwyth gwaith hyd yn oed, cyn belled ag y caiff ei ddefnyddio’n foesegol a chyn belled ag y cydnabyddir ei fod wedi cael ei ddefnyddio. Serch hynny, ni all y Modelau Iaith Mawr hyn roi unrhyw ddata newydd inni, a dim ond cronfa ddata hyd at 2022 sydd gan ChatGPT. 

Aeth Phoey yn ei blaen i sôn am ei gwaith ymchwil yn ymwneud â thestun a gynhyrchir gan AI. Darganfu fod modd gwahaniaethu rhwng testun a gynhyrchir gan AI a thestun a gynhyrchir gan bobl mewn amrywiaeth o ffyrdd: mae ChatGPT yn cynnig ymatebion strwythurol, mae’n cynnal arddull drefnus, mae’n faith ac yn fanwl oni ofynnir yn benodol am grynoder, mae’n niwtral wrth sôn am bynciau sensitif, mae’n ailadrodd cymalau, mae’n defnyddio iaith ddisgwyliadwy, a’r prif gyfyngiad yw na all ddiffinio teimladau dynol. Mae AI yn dysgu trwy ategu adborth gan bobl. 

Yna, cynigiodd Phoey drosolwg byr o adolygiad systematig o ddysgu peirianyddol mewn systemau argymell dros y degawd diwethaf. Mae systemau argymell yn dadansoddi data trwy ddefnyddio algorithmau (data am ymddygiad defnyddwyr, data am bethau a brynwyd yn y gorffennol neu ddata am ddewisiadau) er mwyn creu cynnyrch teilwredig neu argymhellion ynghylch cynnwys i ddefnyddwyr. 

Mae datblygu mwy ar brosesau systemau argymell wedi bod yn bwnc poblogaidd ymhlith gwyddonwyr cyfrifiadurol dros y degawd diwethaf, gyda’r nod o wella’r modd y dadansoddir setiau data mawr a chymhleth. Aeth ymchwil Phoey ati i adolygu’r dulliau a ddefnyddir mewn systemau argymell, gan bennu’r prif ddulliau yn ogystal ag adolygu’r modd y defnyddir gwahanol dechnegau dysgu peirianyddol. 

Dangosodd y canlyniadau fod rhannu setiau data defnyddwyr yn grwpiau llai a haws eu trin yn gallu cyflymu algorithmau ac yn gallu ei gwneud hi’n haws i ddwyn cymhariaeth rhwng y grwpiau. Daeth Phoey â’r seminar i ben trwy sôn am y gwahanol ddulliau algorithm a mesur y gellir eu cyfuno i esgor ar yr argymhellion mwyaf effeithiol. 

Diolch, Phoey, am sesiwn hynod ddiddorol – efallai fod ffilm ‘IRobot’ Will Smith yn perthyn i’r gorffennol pell wedi’r cwbl! Cadwch olwg am y seminar ymchwil olaf yn y gyfres am y flwyddyn academaidd hon, a gynhelir ar 10 Ebrill – sef sesiwn ar y cyd rhwng Celf+ a Gwyddoniaeth.