Adolygiad Systematig o Ddysgu Peirianyddol mewn Systemau Argymell

AI created image of a robot

July 2024

Staff member in front of a presentation screen at a conference

Cyflwynodd Dr Phoey Lee Teh bapur o’r enw “Adolygiad Systematig o Ddysgu Peirianyddol mewn Systemau Argymell dros y Degawd Diwethaf” yng nghynhadledd Cyfrifiadura Deallus 2024.

Os ydych yn ffrydio cynnwys neu’n siopa ar-lein, yn ôl pob tebyg byddwch wedi dod ar draws argymhellion yn ymwneud â chynnyrch neu gynnwys a fydd wedi’u teilwra ar gyfer eich anghenion neu eich chwaeth. Mae papur Dr Teh yn treiddio i’r wyddor data sydd wrth wraidd systemau argymell a ddefnyddiwyd dros y deg mlynedd diwethaf.

Sut y mae systemau argymell yn gweithio?

Yn syml, mae systemau argymell yn defnyddio algorithmau i argymell cynnyrch neu gynnwys i ddefnyddwyr ar sail dewisiadau ac ymddygiadau prynu/ffrydio yn y gorffennol. Mae’r byd technoleg yn awyddus iawn i ddatblygu systemau argymell mor soffistigedig a manwl gywir â phosibl, ac mae gwyddonwyr data wedi mynd ati i ddefnyddio dysgu peirianyddol i wneud y gorau o’r galluoedd hyn.

Mae dysgu peirianyddol yn dadansoddi setiau data mawr i greu argymhellion trwy ddefnyddio gwahanol ddulliau, yn cynnwys:

Hidlo Cydweithredol

Mae’n pennu dewisiadau ac ymddygiadau defnyddwyr â chwaeth debyg, gan wneud argymhellion ar sail y cyffelybiaethau hyn.

Hidlo ar Sail Cynnwys

Mae’n pennu priodoleddau a nodweddion cynhyrchion er mwyn argymell cynhyrchion neu wasanaethau tebyg ar sail nodweddion, themâu neu gynnwys cyffredin.

Systemau Hybrid

Fel yr awgryma’r enw, mae’r dull hwn yn gyfuniad o hidlo cydweithredol a hidlo ar sail cynnwys, a chaiff ei ddefnyddio i gryfhau galluoedd argymell. Mae’r papur yn nodi y gall system hybrid ddefnyddio hidlo cydweithredol, er enghraifft, i bennu grwpiau defnyddwyr â diddordebau tebyg, gan ddefnyddio hidlo ar sail cynnwys wedyn i argymell cynhyrchion penodol i’r grwpiau hynny.

Mae nodau a gofynion penodol y system yn pennu pa ddull yw’r dull mwyaf addas i’w ddefnyddio.

Dysgu Peirianyddol – Rhagor o Fanylion

Gellir dysgu a dehongli data mewn nifer o wahanol ffyrdd:

Dysgu Dan Oruchwyliaeth

Mae’n defnyddio setiau data parod wedi’u labelu er mwyn hyfforddi algorithmau i wneud argymhellion.

Dysgu Heb Oruchwyliaeth

Mae’r cyfrifiadur, heb ymyrraeth gan bobl, yn canfod gwybodaeth ac yn pennu patrymau er mwyn gwneud argymhellion.

Dysgu Dan Rywfaint o Oruchwyliaeth

Dull hybrid sy’n cyfuno dysgu dan oruchwyliaeth a dysgu heb oruchwyliaeth gyda rhai setiau data wedi’u labelu.

Atgyfnerthu Dysgu

Mae’n hyfforddi meddalwedd i greu dilyniant o ddigwyddiadau sy’n rhoi ystyriaeth i’r digwyddiad blaenorol, fel y gwna pobl wrth wneud penderfyniadau.

Canlyniadau

Defnyddir amrywiaeth o dechnegau i ddadansoddi data, gan ddibynnu ar y gwrthrych dan sylw. Algorithm ‘K-means’ yw un o’r dulliau dadansoddi data a ddefnyddir yn gyffredin. Mae’r dull hwn yn gallu hollti setiau data defnyddwyr yn grwpiau llai a mwy hydrin a all gyflymu algorithmau ac arwain at gymharu grwpiau’n well.

Mae’r algorithm ‘K-means’ yn dewis yr un faint o bwyntiau fector â nifer y clystyrau y dymunir eu cael. Yna, mae’n cynnal proses sy’n mesur pellteroedd ac yn ailwerthuso canolau hyd nes y ceir dim mwy o newidiadau fector yn nosbarthiad y clwstwr, gan arwain at sefydlu’r clystyrau.

Datblygwyd amryfal algorithmau i asesu cyffelybiaethau rhwng defnyddwyr, yn cynnwys cyffelybiaethau ‘cosine’ a ‘Pearson’. Caiff y data ei droi’n fformatau rhifiadol gan ddarparu cyfres o fectorau; yn eu tro, caiff y rhain eu defnyddio i bennu lefelau tebygrwydd rhwng defnyddwyr. Gellir teilwra’r algorithmau a’u defnyddio i ddarparu manteision neu oresgyn anfanteision, gan ddibynnu ar y sefyllfa. Hefyd, mae dysgu peirianyddol yn helpu i fynd i’r afael â phroblemau ‘dechrau oer’, lle na cheir data ategol ar gyfer gwrthrychau newydd neu ddefnyddwyr newydd – rhywbeth sy’n cyfyngu ar alluoedd argymell. Yna, gellir defnyddio cyfuniad o brosesau hidlo i esgor ar yr argymhellion gorau.

Daw’r papur i’r casgliad mai ‘K-means’ yw’r dechneg a ddefnyddir yn fwyaf mynych. Defnyddiwyd ‘K-means’ mewn gwahanol systemau argymell mewn amrywiol ddiwydiannau, yn cynnwys dadansoddi rhaglenni teledu. Nodir cyfleoedd ar gyfer ymchwil bellach yn y maes hwn. Gellir darllen y papur llawn yma.