Cyflwyniad syml i'r data

From Hacathon

Jump to: navigation, search

Bydd dogfennaeth manwl ar yr APIs yn cael ei gyhoeddi pan fydd pobl sydd wedi cofrestru i'r digwyddiad yn cael mynediad i'r APIs yn yr wythnos sy'n cychwyn ar y 7fed o Ionawr.

Joke.jpg

Contents

Gorolwg

Franchisepill.jpg

Ar gyfer yr hacathon, rydym yn rhoi mynediad uniongyrchol i'r APIs mae gwefan y prosiect ei hun wedi ei seilio arno, ynghyd รข dau wasanaeth cynorthwyol i symlhau cael at delweddau o'r papurau newydd. Bydd y wefan beta a'r gweinydd delweddau yn ddigonol i rai cyfranwyr, bydd eraill eisiau defnyddio'r APIs eraill i ddatblygu cynigion rhyngweithiol.

Model data'r papurau newydd

Mae'r papurau newydd wedi eu trefnu mewn i deitlau unigol. Mae nifer o rhifynnau gan bob teitl, a nifer o dudalenni gan bob rhifyn. Mae i bob rhifyn erthyglau yn ogystal. Mae peth metadata syml yn perthyn i bob lefel (ee enw teitl, dyddiad rhifyn, rhif tudalen, categori erthygl).

Yr APIs

Mae'r APIs sydd ar gael yn ystod yr hacathon yn rhoi mynediad i'r papurau newydd wedi eu digido a'u metadata. Mae'r data ar gael mewn 3 lle drwy 3 API gwahanol.

Mynegai erthyglau (SOLR)

Drwy'r mynegai ceir mynediad i destun pob erthygl. Mae SOLR yn caniatau chwilio testun cyfan erthyglau a'r metadata ynglwm a'r erthygl, fel gwybodaeth am ddarluniau, tudalen, rhifyn a dyddiad yr erthygl ac awdur yr erthygl os oes un wedi ei adnabod. Dyma fydd y ffynhonell fwyaf defnyddiol i'r rhan fwyaf o'r cyfranwyr.

Delweddau (IIP Image Server)

Mae mynediad i'w gael i'r delweddau wedi eu sganio o'r papurau newydd gwreiddiol. Mae'r delweddau ar gael mewn meintiau gwahanol a mae'r API yn canitau gofyn am ddarnau sbesiffig o dudalen, gan alluogi echdynnu delweddau safon uchel o erthyglau neu hysbysebion unigol. Mae llawer o berlau y casgliad yma i'w canfod yn yr hysbysebion a darluniau sy'n cynnig golwg ar broblemau, cynhyrchion a dulliau marchnata'r oes. Mi welwch hysbysebion am bob math o bethau, gan gynnwys dillad, datblygiadau technegol a moddion.

Mae modd gofyn am ddelweddau hefyd drwy ddau wasanaeth cynorthwyol, sy'n ei wneud yn haws i gael delwedd o dudalen neu erthygl heb y cam o orfod cyfieithu'r IDs a geir yn y metadata mewn i godau tudalen sydd eu hangen i gael delwedd gan y gweinydd delweddau.

Strwythr (CouchDB)

Ar gyfer y rheini sy'n fwy technegol mae hefyd mynediad i gronfa CouchDB. Yma ceir y wybodaeth am strwythr y casgliad, yn disgrifio'r berthynas rhwng Teitlau, Rhifynnau, Tudalenni ac Erthyglau. Dyma'r API i'w ddefnyddio os am ddatblygu porwr ar gyfer y casgliad. Mae'r gronfa yma hefyd yn cynnwys yr XML sy'n disgrifio trefniant y dudalen, drwy ddefnyddio system gyfesurynnau (coordinates) i ddiffinio bocsiau terfynnu. Mae'n cynnwys holl destyn yr dudalen ac yn rhoi cyfesurynnau ar gyfer nifer o lefelau, o'r dudalen lawr i'r geiriau unigol. Drwy ddefnyddio hwn, gellid echdynnu rhannau priodol yn unig o'r dudalen drwy'r gweinydd delweddau.

Personal tools
Namespaces
Variants
Actions
Navigation
Toolbox