نالج گراف تعمیراتی دوم۔ نالج گراف کی تعریف اور فن تعمیر

Knowledge Graph Construction Ii



علم گراف کے ذریعہ دی گئی اصطلاح کی ویکیپیڈیا کی ترجمانی اب بھی گوگل کی تعریف پر عمل پیرا ہے ، یعنی: علم گراف گوگل کا معاون علم ہے جو اس کے سرچ انجن کے افعال کو بڑھانے کے لئے استعمال ہوتا ہے۔ تاہم ، صنعت کی ترقی کے نقطہ نظر سے ، یہ تعریف بہت آسان معلوم ہوتی ہے۔ جولائی 2013 میں مائیکرو سافٹ نے اپنے ستوری علمی اڈے کے اجراء کے بعد ، بنگ سرچ انجن پروڈکٹس کے سینئر ڈائریکٹر ، ویزز نے عوامی طور پر بتایا کہ ستوری کی رہائی سے ہی یہ ظاہر ہوتا ہے کہ مائیکروسافٹ کے پاس پہلے سے ہی ایسی ہی ٹکنالوجی موجود ہے ، لیکن ابھی بھی بہت سی موجود ٹیکنالوجیز خود موجود ہیں۔ مسئلہ یہ ہے کہ مائیکروسافٹ گوگل کی پیروی کرنے کی بجائے قیادت حاصل کرنا چاہتا ہے۔ یہ بیان اس فیلڈ کے پیچھے سخت تکنیکی مقابلہ کی عکاسی کرتا ہے۔ فی الحال انکشاف کردہ تجارتی مصنوعات سے ، یہ بھی دیکھا جاسکتا ہے کہ صنعت عام طور پر اس کو اہمیت دیتی ہے۔ جدول 1 میں مرکزی دھارے میں موجود سابقہ ​​علم کی بنیادی مصنوعات اور متعلقہ اطلاقات کو ظاہر کیا گیا ہے۔ ان میں سے ، اداروں کی سب سے بڑی تعداد وولفرم الفا علمی اساس ہے۔ اداروں کی کل تعداد 10 کھرب سے تجاوز کر گئی ہے۔ گوگل کے علمی گراف میں 500 ملین ادارے اور 35 بلین ہستی ہیں۔ ان کے مابین تعلقات اور پیمانے میں مسلسل اضافہ ہوتا جارہا ہے۔ مائیکرو سافٹ کے پروبیس میں موجود تصورات کی کل تعداد دس ملین کی سطح پر پہنچ چکی ہے۔ یہ علمی مرکز ہے جس میں اس وقت تصورات کی سب سے بڑی تعداد موجود ہے۔ ایپل سیری ، گوگل نو اور دیگر فی الحال مشہور اسمارٹ اسسٹنٹ ایپلی کیشنز ولف्राम الفا علم پر مبنی ہیں۔ لائبریری اور گوگل کا علمی گراف۔ غور طلب ہے کہ چین میں کچھ علمی گراف کی مصنوعات اور ایپلی کیشنز بھی سامنے آئے ہیں ، جیسے سوگو کا علم مکعب ، جو گراف کے منطقی استدلال کے حساب کتاب پر مرکوز ہے۔ یہ سیمنٹ نیٹ ورک پر مبنی ٹرپل استدلال کے ذریعہ ہستی کے اعداد و شمار کی تکمیل کرسکتی ہے ، اور صارف کے سوالات اور مصنوعی تجزیہ ، وغیرہ کو بے ساختہ سمجھ سکتی ہے۔



جیسا کہ جدول 1 سے دیکھا جاسکتا ہے ، روایتی سرچ سروس فراہم کرنے والوں کے علاوہ ، انٹرنیٹ قائدین جن میں فیس بک ، ایپل ، آئی بی ایم اور دیگر شامل ہیں ، نے بھی اس مقابلے میں حصہ لیا ہے۔ چونکہ متعلقہ ٹیکنالوجیز اور معیار ابھی تک پختہ نہیں ہوئے ہیں اور ان کی درخواستیں بھی ایکسپلوریشن مرحلے میں ہیں ، لہذا علم گراف کا تصور اب بھی ترقی اور تبدیلی کے عمل میں ہے۔ موجودہ تحقیقی نتائج کا موازنہ اور ان کی تطہیر کرکے ، یہ مضمون علم گراف کی تعریف کی تجویز کرتا ہے۔



1.1۔ علم گراف کی تعریف



تعریف 1: نالج گراف ایک سنچرت کا شکار علمی اساس ہے ، جو جسمانی دنیا میں علامات کی شکل میں تصورات اور ان کے باہمی تعلقات کو بیان کرنے کے لئے استعمال ہوتا ہے۔ اس کی بنیادی اکائی 'ہستی سے تعلق رکھنے والی ہستی' ٹرپلٹ ہے ، نیز اس کے ساتھ ساتھ ہستی اور اس سے وابستہ خاصیت کی قدر کے جوڑے بھی ہیں ، اور ہستی ایک دوسرے سے جڑے ہوئے ہیں تاکہ نیٹ ورک سے متعلق علمی ڈھانچہ تشکیل پائے۔

علم کے گراف کے ذریعے ، ویب کو ویب پیج لنکس سے نظریاتی روابط میں تبدیل کیا جاسکتا ہے ، جس سے صارفین کو کردار کی تار کے بجائے مضمون کی طرف سے تلاش کرنے میں مدد ملتی ہے ، اور اس طرح صحیح معنوں میں تلاش کا نفاذ ہوتا ہے۔ علم کے گراف پر مبنی سرچ انجن صارفین کو ساختی علم کی تزئین آرائش گراف کے مطابق دے سکتا ہے۔ صارفین بڑی تعداد میں ویب صفحات کو تلاش کیے بغیر گہرائی میں علم کو درست طریقے سے تلاش اور حاصل کرسکتے ہیں۔

تعریف 1 میں 3 معنی ہیں:



1) نالج کا گراف خود ہی ایک نیٹ ورک نالج کا اساس ہے جو رشتوں سے منسلک صفات کے ساتھ ہستیوں کے ذریعہ تشکیل دیا جاتا ہے۔ گراف کے نقطہ نظر سے ، علمی گراف بنیادی طور پر ایک تصوراتی نیٹ ورک ہے ، جس میں نوڈس جسمانی دنیا میں ہستیوں (یا تصورات) کی نمائندگی کرتے ہیں ، اور اداروں کے مابین مختلف معنوی رشتے نیٹ ورک میں کناروں کو تشکیل دیتے ہیں۔ اس طرح ، علم کا گراف جسمانی دنیا کا ایک علامتی اظہار ہے۔

2) علم کے گراف کی تحقیقی قدر یہ ہے کہ یہ موجودہ ویب کی بنیاد پر اوورلے نیٹ ورک (اوورلی نیٹ ورک) کی ایک پرت ہے۔ علم کے گراف کی مدد سے ، ویب پیج پر تصورات کے مابین ربط قائم کرنا ممکن ہے ، تاکہ لاگت کو کم کیا جاسکے ، انٹرنیٹ میں جمع معلومات کو علم میں منظم کیا گیا ہے جس کو استعمال کیا جاسکتا ہے۔

3) علم کے گراف کی اطلاق کی قیمت یہ ہے کہ وہ موجودہ معلومات کے بازیافت کے طریقہ کار کو تبدیل کرسکتا ہے۔ ایک طرف ، یہ استدلال کے ذریعہ تصور کی بازیافت کا ادراک کرتا ہے (دوسری طرف فجی میچنگ کے موجودہ طریقہ کے مقابلے میں) ، یہ صارفین کو گرافیکل طریقہ فراہم کرتا ہے۔ ترتیب شدہ اور منظم علم کو ظاہر کریں ، تاکہ لوگوں کو جوابات تلاش کرنے کے لئے ویب صفحات کو دستی طور پر فلٹر کرنے کے موڈ سے آزاد کیا جاسکے۔

1.2 ، علم گراف کی ساخت

علم گراف کی ساخت ، بشمول علمی گراف کی منطقی ڈھانچہ اور تکنیکی گراف (سسٹم) فن تعمیر جو علم گراف کی تعمیر کے لئے استعمال ہوتا ہے۔

پہلے گراف کے منطقی ڈھانچے کو متعارف کروائیں ، منطقی طور پر علم گراف کو دو سطحوں میں تقسیم کریں: ڈیٹا پرت اور پیٹرن پرت۔ علم گراف کے ڈیٹا پرت پر ، علم حقائق کی اکائیوں میں گراف ڈیٹا بیس میں محفوظ کیا جاتا ہے۔ مثال کے طور پر ، گوگل کا گرافڈ اور مائیکروسافٹ کا تثلیث عام گراف ڈیٹا بیس ہیں۔ اگر حقائق کے بنیادی اظہار کے طور پر 'ہستی سے تعلق رکھنے والی ہستی' یا 'ہستی سے وابستگی-املاک کی قیمت' ٹرپلٹ استعمال کیا جاتا ہے تو ، گراف ڈیٹا بیس میں محفوظ کردہ تمام ڈیٹا ایک بہت بڑا ہستی سے وابستہ نیٹ ورک تشکیل دے گا ، جس سے 'گراف' تشکیل پائے گا علم ''۔

ماڈل پرت اعداد و شمار کی پرت سے اوپر ہے اور علم گراف کی بنیادی ہے۔ ماڈل پرت میں ذخیرہ شدہ علم کو بہتر بنایا جاتا ہے ، عام طور پر علم گراف کی ماڈل پرت کو منظم کرنے کے لئے اونٹولوجی لائبریری کا استعمال کرتے ہوئے ، اونٹولوجی لائبریری کے اعداد و شمار ، قواعد ، اور ہستیوں ، رشتے اور اقسام اور خصوصیات کو منظم کرنے میں رکاوٹوں کی تائید کرنے کی صلاحیت کا استعمال کرتے ہوئے۔ رابطہ۔ علم گراف میں اونٹولوجی ڈیٹا بیس کی حیثیت علم کی بنیاد کے برابر ہے ، اور اونٹولوجی ڈیٹا بیس کے ساتھ علم کی بنیاد میں بے کار معلومات کم ہیں۔

اگلا ، علم گراف کی تعمیر کے نقطہ نظر سے ، علم گراف کا عمومی تکنیکی فن تعمیر متعارف کروائیں۔ چترا 1 علم گراف ٹیکنالوجی کی مجموعی فن تعمیر کو ظاہر کرتا ہے۔ بندیدار فریم کا حصہ علم گراف کی تعمیر کا عمل ہے ، اور یہ بھی کہ گراف کو اپ ڈیٹ کرنے کا عمل ہے۔ جیسا کہ شکل 1 میں دکھایا گیا ہے ، علمی گراف کی تعمیر کا عمل اصل اعداد و شمار پر مبنی ہے ، جس میں اصل اعداد و شمار سے علم کے عناصر (یعنی حقائق) نکالنے اور اعداد و شمار کی پرت میں اسٹور کرنے کے لئے خود کار طریقے سے یا نیم خودکار تکنیکی ذرائع کی ایک سیریز کا استعمال کیا گیا ہے۔ علم کی بنیاد اور ماڈل پرت کا عمل۔ یہ تکراری تازہ کاری کا عمل ہے۔ علم حصول کی منطق کے مطابق ، ہر تکرار میں 3 مراحل ہوتے ہیں: معلومات نکالنا ، علم فیوژن اور علم پروسیسنگ۔

علم کے گراف میں دو تعمیراتی طریقے ہیں: اوپر-نیچے اور نیچے-نیچے۔ نام نہاد ٹاپ ڈاون تعمیر کا مطلب اعداد و شمار کے ذرائع کا استعمال کرنا ہے جیسے انسائیکلوپیڈیا کی ویب سائٹیں اعلی معیار کے ڈیٹا سے اونٹولوجی اور پیٹرن کی معلومات نکالیں اور اس کو علم کے اڈے میں شامل کریں تاکہ نام نہاد نیچے کی تعمیر کو کچھ استعمال کرنا ہے تکنیکی ذرائع وسائل پیٹرن عوامی سطح پر جمع کردہ اعداد و شمار سے نکالا جاتا ہے ، اور اعلی اعتماد کے ساتھ نیا نمونہ منتخب کیا جاتا ہے ، اور دستی جائزہ لینے کے بعد ، اس کو علم کی بنیاد میں شامل کیا جاتا ہے۔

علم گراف ٹکنالوجی کی ترقی کے آغاز میں ، زیادہ تر شریک کمپنیوں اور سائنسی تحقیقاتی اداروں نے بنیادی معلومات کی بنیاد بنانے کے لئے اوپر سے نیچے تک رسائی حاصل کی۔ مثال کے طور پر ، فری بیس پروجیکٹ ویکیپیڈیا کو بطور مرکزی ڈیٹا ماخذ استعمال کرتا ہے۔ خود بخود علم نکالنے اور پروسیسنگ ٹکنالوجی کی مستقل پختگی کے ساتھ ، بیشتر موجودہ علمی گراف نیچے والے انداز میں بنائے جاتے ہیں۔ سب سے زیادہ متاثر کن مثالوں میں گوگل کا نالج والٹ اور مائیکروسافٹ کا ستوری نالج بیس شامل ہیں ، جو دونوں ہی عوام میں جمع کیے جاتے ہیں۔ ویب پیج کا ڈیٹا ڈیٹا کا ماخذ ہے ، اور موجودہ علمی اساس کو خود بخود وسائل نکالنے سے تعمیر ، افزودہ اور بہتر بنایا جاتا ہے۔

اگلا ، میں نیچے گراف تعمیراتی ٹکنالوجی کو متعارف کراؤں گا۔ علم کے حصول کے عمل کے مطابق ، یہ بنیادی طور پر تین سطحوں میں منقسم ہے: معلومات نکالنا ، علم فیوژن اور علم کی پروسیسنگ ، لہذا آپ رابطہ رکھیں۔