Kakva je razlika između grafikona znanja i baze podataka grafova?


Odgovor 1:

"Grafikon znanja" i "Grafička baza podataka" dva su marketinški orijentirana pojma (zujanje) koje su povezane sa strukturiranim predstavljanjem podataka (re Graf znanja) i sustavima za upravljanje bazama podataka (ponovno Graph Database).

"Grafički" aspekt ovih glasnih fraza odnosi se na model odnosa entiteta koji se obično prikazuje kao grafički grafički prikaz (mrežni ili web dijagram).

Aspekt „Znanja“ ovih buzz fraza odnosi se na semantiku entitetskih odnosa (odnosi) izraženu u modelu odnosa s entitetima.

"Grafikon znanja" u osnovi je priroda strukturiranih podataka (organiziranih kao dokument baze podataka) kojima upravlja "Sustav za upravljanje bazama podataka grafikona" koristeći različite deklarativne jezike upita (neki od njih temelje se na otvorenim standardima, npr. SQL, SPARQL, dok drugi su vlasnički i specifični za proizvod, npr. Cypher i drugi).

Zašto imamo ove frazu?

Dobavljači sustava za upravljanje relacijskim bazama podataka (RDBMS) u osnovi su ukrali originalni relativni model Edgara Codda putem onog što je postalo Coddovo 12 (zapravo 13 predmeta zbog indeksiranja na temelju nule) Pravila relacijskih baza podataka.

Nažalost, gore navedeni pokušaj pretvorio je generičku prirodu Coddovog originalnog apstraktnog relacijskog modela u model specifičan za implementaciju gdje su odnosi predstavljeni na specifičan, a ne generički način, tj. N-Tuples (prikazani kao Tablice) gdje je svaki Član Relacije jedinstveno identificiran Primarni ključ - što je suprotno općem relacijskom modelu koji jednostavno zahtijeva da se podaci izraze kao odnosi koji sadrže tapove.

Tuples mogu imati različite oblike koji uključuju: N-Tuples (što nudi većina RDBMS proizvoda), 3-Tuples (što nude RDF-sukladni [R] DBMS proizvodi), 4-Tuples (što RDF-sukladni [R] DBMS proizvodi koje podržavaju ponudu Named Graphs) i druge.

Neto učinak svega ovoga doveo je do novog podvrsta DBMS naziva Not-Only-SQL (NoSQL) kojoj pripadaju „Graph Databases“.

Model odnosa sa entitetima (prikazan kao grafikon)

Dijagram definicije relacijske baze podataka (prikazan kao tablice)

Tabelirani DBMS žanrovi

Nastanak NoSQL-a prirodno je doveo do proširenja žanrova DBMS-a kako je prikazano u donjoj tablici:

Kliknite ovdje za detaljni prikaz revidirane tablice žanra DBMS.

Primjeri grafikona znanja?

Na temelju mog osobnog iskustva sudjelovanja u projektu, evo nekoliko primjera grafikona znanja koji su slobodno dostupni i dostupni svima opremljenim računalnim uređajem koji podržava HTTP protokol, tj. Uređajem koji može pretraživati ​​i istraživati ​​znanje kao odgovor na korisnikova klika:

  • Povezani oblak otvorenih podataka (zasijano od DBpedia) - ovo je raspodijeljena baza znanja (ili graf znanja) koja sadrži strukturirane podatke raspoređene na principima povezanih podataka (tj. Model odnosa entiteta gdje se entitet, atributi i vrijednost [po želji] identificiraju pomoću hiperveza [ tj. HTTP URI]).

Svaki je čvor u oblaku iznad povezan s domenom znanja i u potpunosti se može istražiti interakcijama između ljudi i / ili pregledima softverskog agenta putem SPARQL ili SQL upita.

Vezani

  • Relativni model podataka za velike zajedničke banke podataka - Seminarni članak Edgara Codda-aCodd i relacijski model-odnos odnosa modela - prema jedinstvenom prikazu podataka - seminarski rad Petera Chena, konceptualni grafikon za sučelje baze podataka - seminarski rad Johna F. Sowa-aKonceri i zaključci o „ Grafička baza podataka "Izraz" Što je DBpedia i zašto je to važno? Što je povezani oblak otvorenih podataka i zašto je to važno? Što su mali podaci i zašto su važni? Rječnik

Odgovor 2:

Baza podataka grafova (često) nanizan je grafikon znanja.

Grafikon znanja: Grafikon znanja je baza znanja koja je učinjena strojno čitljivom pomoću logički konzistentnih, povezanih grafova koji zajedno čine međusobno povezane činjenice. Graf u ovom kontekstu mogao bi biti, na primjer, povezani skup trostrukih RDF.

Pojedinačna RDF trojka predstavlja ljudsko znanje u standardnom, strojno čitljivom obliku povezivanjem subjekta, glagola i objekta (S-V-O) zajedno za koje se zna da su povezani. Ove trojke nalikuju jednostavnim rečenicama ljudskog jezika S-V-O, koje su činile strogo čitljive, kao što je Ian poznaje Mariju.

Primjer RDF trostruke. Iz “jezgrenog RDF API-ja”, Apache Jena Documentation, 2011-2019.

U isto vrijeme, ovaj RDF prikaz može se vizualno prikazati i kao čvorovi (subjekti i objekti) i rubovi (glagoli ili predikati) grafova.

Kad je riječ o dobrom vjeri, operativnom grafikonu znanja, ova vrsta trostruke obrade može biti i strogo čitljiva činjenica.

Trostruke činjenice povezane na logički konzistentan način putem grafikona znanja imaju moć rasuđivanja. Kad se logički stave dosljedne faktičke trojke dodaju u grafikon, strojevi mogu zaključiti nove veze ili veze. veze koje su strojevima učinili ljudima otkriti. Strojevi tada mogu pružiti pristup podacima u tim povezanim trojkama, grafovima znanja ili povezanim činjenicama kao dio informacijske usluge.

Google je počeo nuditi informacijske usluge temeljene na grafovima znanja u 2010.-ima nakon što je stekao Freebase 2010. godine.

Recimo u našem primjeru da Ian poznaje Mariju jer oboje voze autobusnom linijom 23 VTA (Valley Transportation Authority) radnim danom. I da su se jednom odvezli istim autobusom do istog stajališta i otkrili da oboje rade na istom mjestu.

Ako Google ima dozvolu za praćenje lokacije putem pametnih telefona Marije i Iana, iz detalja o praćenju lokacije može se zaključiti da svaki radi na istom mjestu.

Mary, na primjer, može naučiti što Google zna o njoj tako što će Googleu dati dopuštenje za praćenje, a zatim gledati što Google Maps radi. Google Maps nakon što prati Mariju iz dana u dan zaključuje da ona radnim danima odlazi na radno mjesto te se u nekom trenutku nakon posla uglavnom vraća na lokaciju Početna. Google će prikazati ove zaključke na Marijinom pametnom telefonu kada koristi Google karte.

Zbog razmatranja privatnosti i dizajnerskih odluka, Google ne prikazuje Mariji da Ian radi na istom mjestu na kojem radi i Mary. No, postoje i aplikacije na društvenim mrežama koje, uz odgovarajuća dopuštenja, pružaju ovakav uvid.

Baza podataka grafikona: baze podataka grafikona često se koriste za pohranu podataka grafikona znanja. Po Wikipediji,

  • "Baza podataka je organizirana zbirka podataka, koja se obično pohranjuju i elektronički joj se pristupa iz računalnog sustava." Opće baze podataka grafova u koje se može pohraniti bilo koji graf razlikuju se od specijaliziranih baza podataka grafikona, poput triplestora i mrežnih baza podataka. "

Sustav upravljanja bazama podataka: po Wikipediji,

  • "Formalno" baza podataka "odnosi se na skup povezanih podataka i način na koji je organiziran. Pristup tim podacima obično omogućuje "sustav upravljanja bazama podataka" (DBMS) koji se sastoji od integriranog skupa računalnog softvera koji omogućuje interakciju s jednom ili više baza podataka i omogućuje pristup svim podacima koji se nalaze u bazi podataka (iako su ograničenja mogu postojati one koje ograničavaju pristup određenim podacima). DBMS pruža različite funkcije koje omogućuju unos, pohranu i pronalaženje velike količine informacija i pruža načine upravljanja načinom na koji su te informacije organizirane. "Zbog bliskog odnosa između njih, izraz" baza podataka "često se koristi ležerno da bi označio obje baze podataka i DBMS koji se koriste za manipulaciju s njima. "

Iz baze podataka - Wikipedija, 2019

Od lipnja 2019. DB-Engines pratili su 32 različita DBMS-a s grafikonima. Među prvih 12 u tom su se trenutku nalazili DBMS-ovi s grafom svojstava, kao što su Neo4j i Arango DB i RDF quad-ovi poput Allegrograph, Virtuoso i Stardog. Pogledajte Rangiranje DB-motora za trenutni poredak.

2019. godine World Wide Web Consortium (W3C) započeo je postupak standardizacije podataka grafova, pokušaj spajanja i omogućavanja standardne pretvorbe podataka grafikona iz jednog oblika u drugi, podataka predstavljenih na različite načine, kao npr. U grafikonima svojstava, RDF, ili u relacijskom obliku. Pogledajte W3C radionicu o web standardizaciji za grafičke podatke

Neke su organizacije izgradile grafikone znanja koristeći tehnologiju relacijske baze podataka, a bilo koji graf može biti predstavljen u relacijskom DB obliku. Ali grafičke su baze podataka postale popularne zbog većeg statusa koji su im dodijeljeni podacima o odnosima (tj. Glagoli u rečenicama). Ironično je da su podaci o vezama često sahranjeni ili nestali iz relacijskih baza podataka. Gdje bi bila ljudska logika i jezik ako bi iz naših rečenica nedostajali glagoli?

Podaci o vezama su od presudne važnosti za integraciju i interoperaciju velikih razmjera svojstvenih kontekstualnom računanju, a stvaranje i upravljanje tim kontekstima na fleksibilan, skalabilan način stvaranjem eksplicitnih odnosa postalo je ključno za integriranje velikih razmjera i prilagođavanje potrebnim za potragu za umjetnim općenito inteligencija.

Pogledajte opis Johna Launchburyja o tri faze AI za više detalja o kontekstualnom računanju i kontekstualnoj fazi AI.

Sve više i više tvrtki stvara grafikone znanja kao sredstvo za skaliranje svojih AI napora. Pogledajte primjer e-trgovine u poglavlju Zašto su grafikoni znanja utemeljeni na umjetnoj inteligenciji.

Hvala za A2A, Terri Gilbert.