ماخذ: ڈیٹا جیانگ ٹینگ
مصنف: جیانگ نے اسٹار کو قدم رکھا
اس مضمون کی لمبائی ہے 1320 لفظ ، یہ پڑھنے کی سفارش کی جاتی ہے 3 منٹ
یہ مضمون آپ کے لئے بیرونی اشارے کے اخذ کی وضاحت کرتا ہے۔
ہم غیر ملکی کلیدی شمولیت پر تبادلہ خیال کرتے رہتے ہیں ، اور پچھلی مثال کو استعمال کرتے رہتے ہیں۔
جب میموری میں فٹ ہونے کے لئے اعداد و شمار کی مقدار بہت زیادہ ہوتی ہے تو ، مذکورہ بالا پوائنٹر کا طریقہ کارگر ثابت نہیں ہوتا ہے ، کیونکہ پہلے سے گنتی والا پوائنٹر بیرونی میموری میں محفوظ نہیں ہوسکتا ہے۔
عام طور پر اگر بات کی جائے تو ، غیر ملکی کلید کی طرف اشارہ کرنے والے طول و عرض کی گنجائش کم ہے ، جبکہ بڑھتی ہوئی حقائق کی میز زیادہ بڑی ہے۔ اگر میموری طول و عرض کی میز کو نیچے رکھ سکتا ہے تو ، ہم غیر ملکی کلیدوں سے نمٹنے کے لئے عارضی اشارے کا طریقہ استعمال کرسکتے ہیں۔
1. پی = فائل ("product.txt"). درآمد ()
مصنوعات کی معلوماتی شیٹ پی پڑھیں
2. P.index (ID)
تلاش کی سہولت کے ل P P کی بنیادی کلیدی شناخت کے ل an ایک انڈیکس تشکیل دیں
3. ایس = فائل ("বিক্রয়.txt")۔ کرسر ()
اجناس کی فروخت کے ریکارڈ کے لئے کرسر ایس قائم کریں ، اور آہستہ آہستہ ڈیٹا میں پڑھیں
4. ایس سوئچ (پروڈکٹڈ ، پی: ID)
جب ڈیٹا کو بہاؤ دیا جاتا ہے تو ، ایس میں پیداواری فیلڈ P کی بنیادی کلید کے مطابق P کے ریکارڈ میں تبدیل ہوجاتا ہے
5. ایسسم (مقدار * producttid.price)
فروخت کا حساب لگائیں
پہلے دو مراحل ایک جیسی ہیں جیسے مکمل میموری کے معاملے میں۔ مرحلہ 4 میں پوائنٹر تبادلوں کو پڑھتے ہوئے انجام دیا جاتا ہے ، اور تبادلوں کا نتیجہ برقرار نہیں رہ سکتا ہے اور دوبارہ استعمال نہیں کیا جاسکتا ہے۔ HASH اور موازنہ کا حساب اس وقت کیا جائے گا جب ایسوسی ایشن اگلی بار بنے گی۔ کارکردگی مکمل سے بہتر ہے میموری اسکیم ناقص ہے۔ حساب کتاب کی رقم کے لحاظ سے ، طول و عرض جدول کی HASH قیمت کا حساب HASH طبقاتی اسکیم سے کم ہے ۔یہ طول و عرض جدول اگر دوبارہ استعمال کیا جاتا ہے تو یہ سستا ہوگا ، لیکن طول و عرض جدول نسبتا small چھوٹا ہے لہذا ، مجموعی فائدہ زیادہ نہیں ہے۔ تاہم ، اس الگورتھم میں مکمل میموری الگورتھم کی خصوصیات بھی ہیں جو ایک ساتھ میں تمام غیر ملکی چابیاں کا تجزیہ کرسکتی ہیں اور اسے متوازی بنانا آسان ہے ۔حقیقی منظرناموں میں ، اس میں HASH طبقاتی الگورتھم سے کہیں زیادہ کارکردگی کا فائدہ ہے۔
اس الگورتھم کی بنیاد پر ، ہم ایک مختلف حالت بھی بنا سکتے ہیں۔ غیر ملکی کلیدی سیریلائزیشن .
اگر ہم طول و عرض جدول کی بنیادی کلید کو 1 سے شروع کرکے قدرتی نمبر میں تبدیل کرسکتے ہیں ، تو ہم HASH قدر کا حساب لگانے اور اس کا موازنہ کیے بغیر ، سیریل نمبر کے ساتھ طول و عرض جدول کے ریکارڈ کو براہ راست تلاش کرسکتے ہیں ، تاکہ ہم پوری میموری کی طرح ایک پوائنٹر حاصل کرسکیں۔ کارکردگی
1. پی = فائل ("product.txt"). درآمد ()
پروڈکٹ انفارمیشن ٹیبل P میں پڑھیں ، اس کی بنیادی کلیدی شناخت سیریل نمبر ہے
2. ایس = فائل ("বিক্রয়.txt")۔ کرسر ()
اجناس کی فروخت کے ریکارڈ کے لئے کرسر ایس قائم کریں ، اور آہستہ آہستہ ڈیٹا میں پڑھیں
3. ایس سوئچ (مصنوعہ ، P: #)
ایس میں پیداواری فیلڈ کو پی میں متعلقہ سیریل نمبر کے ریکارڈ میں تبدیل کریں جب ڈیٹا کو اسٹریم کرتے ہیں
4. ایسسم (مقدار * producttid.price)
فروخت کا حساب لگائیں
سیریل نمبر پرائمری کلید کے طول و عرض کی میز کو HASH انڈیکس بنانے کے دوسرے مرحلے کی ضرورت نہیں ہے۔
غیر ملکی چابیاں کا سیریلائزیشن لازمی طور پر بیرونی میموری میں اشارے کے ادراک کے برابر ہے۔ اس حل کو فیکٹ ٹیبل میں غیر ملکی کلیدی فیلڈ کو ایک تسلسل نمبر میں تبدیل کرنے کی ضرورت ہے ، جو مکمل میموری آپریشن میں ایک پوائنٹر قائم کرنے کے عمل کی طرح ہے ، اور اس پری حساب کتاب کو بھی دوبارہ استعمال کیا جاسکتا ہے۔ واضح رہے کہ جب طول و عرض کی ٹیبل میں بڑی تبدیلیاں آرہی ہیں تو ، فیکٹ ٹیبل کے غیر ملکی کلیدی شعبوں کو ہم آہنگی کرنے کی ضرورت ہے ، بصورت دیگر خط و کتابت غلط ہوسکتی ہے۔ تاہم ، عمومی طول و عرض کے جدول میں تبدیلیوں کی تعدد کم ہے ، اور زیادہ تر عمل حذف کرنے کے بجائے اضافے اور ترمیم ہیں۔ بہت سارے معاملات ایسے نہیں ہیں جہاں حقائق کی میز کو از سر نو ترتیب دینے کی ضرورت ہے۔
ایس کیو ایل غیر منظم مجموعہ کے تصور کو استعمال کرتا ہے۔ یہاں تک کہ اگر ہم غیر ملکی کلید کو پہلے سے ہی سیریلائز کردیتے ہیں تو ، ڈیٹا بیس اس خصوصیت کا فائدہ نہیں اٹھاسکتا ہے۔ یہ غیر ترتیب شدہ مجموعہ میں ترتیب نمبروں کے ساتھ تیز رفتار پوزیشننگ کے لئے کوئی طریقہ کار مہی cannotا نہیں کرسکتا ہے۔ یہ جانتے ہوئے کہ غیر ملکی کیلی کو سیریلائزڈ کیا گیا ہے ، اس کے بعد ہیش قدر اور موازنہ کا حساب لگایا جائے گا۔
اگر طول و عرض جدول اتنا بڑا ہو کہ میموری میں فٹ نہیں ہے؟
جب ہم مذکورہ بالا الگورتھم کا بغور جائزہ لیں تو ہم پائیں گے کہ فیکٹ ٹیبل تک رسائی مستقل ہے ، لیکن طول و عرض تک رسائی بے ترتیب ہے۔ جیسا کہ ہم نے پہلے بھی ذکر کیا تھا کہ ہارڈ ڈرائیوز کی کارکردگی کی خصوصیات پر گفتگو کرتے وقت ، بیرونی اسٹوریج بے ترتیب رسائی کے لئے موزوں نہیں ہے۔ اگر آپ بیرونی میموری میں طول و عرض کی میز رکھتے ہیں اور پھر مذکورہ بالا الگورتھم کو عملی شکل دیتے ہیں تو ، کارکردگی HASH طبقاتی الگورتھم سے کہیں زیادہ خراب ہوگی ، اور یہ انضمام سے پہلے دو میزیں چھانٹنے کی کارکردگی کو بھی پکڑ نہیں پائے گی۔
اس وقت ہمیں کلسٹر کی طاقت سے فائدہ اٹھانا ہے۔
ایک مشین کی میموری فٹ نہیں ہوسکتی ہے ، آپ اسے انسٹال کرنے کے لئے اور بھی کئی مشینیں بناسکتے ہیں ، کلسٹر طول و عرض کی میز بنانے کے ل multiple ایک سے زیادہ مشینوں پر طول و عرض جدول تقسیم کرسکتے ہیں ، اور پھر آپ مندرجہ بالا الگورتھم کا استعمال جاری رکھ سکتے ہیں اور ایک وقت میں متعدد غیر ملکی چابیاں حاصل کرسکتے ہیں۔ اور آسانی سے ہم آہنگی کے فوائد۔ اسی طرح ، کلسٹر طول و عرض جدول بھی سیریلائزیشن ٹیکنالوجی استعمال کرسکتا ہے۔
یہ یاد رکھنا چاہئے کہ میموری نہ صرف بے ترتیب رسائی کے ل suitable موزوں ہے ، بلکہ چھوٹی موٹی رسائی تک بھی ہے۔ اگرچہ کلسٹر طول و عرض کی میز میموری میں محفوظ ہے ، لیکن وسط میں زیادہ سے زیادہ نیٹ ورک ٹرانسمیشن موجود ہے ، اور یہ نیٹ ورک چھوٹی اور بار بار رسائی کے لئے موزوں نہیں ہے۔ اس وقت ، جب حقائق کی میز کو عبور کرتے ہیں تو ، آپ ایک وقت میں صرف ایک ریکارڈ پر کارروائی نہیں کرسکتے ہیں جیسے اسٹینڈ اکیلے وضع میں ، اس کے بجائے ، آپ کو بیچوں میں ریکارڈوں کا ایک بیچ پڑھنے ، ان کو جمع کرنے اور طول و عرض کی میز حاصل کرنے کے ل them انہیں ہدف کلسٹر نوڈ پر بھیجنے کی ضرورت ہے۔ متعلقہ فیلڈز
طول و عرض کی میزوں کی یادداشت کو یقینی بنانا کارکردگی کو بہتر بنانے کا ایک اہم عنصر ہے۔ جدید کمپیوٹرز کی یادداشت کی گنجائش کے لئے ، زیادہ تر طول و عرض کی میزیں کسی ایک مشین کی یاد میں رکھی جاسکتی ہیں ، اور بہت کم جہت میزوں کی ایک بڑی تعداد کلسٹر طول و عرض جدول کے ذریعہ عمل میں لائی جاتی ہے ، جو طول و عرض کی میزوں تک اعلی کارکردگی کی بے ترتیب رسائی کو یقینی بناسکتی ہے۔ اگر ایک جہت کی میز موجود ہے جو کلسٹر کے قابل بھی نہیں ہے تو ، اسے ابھی بھی غیر موزوں HASH طبقاتی الگورتھم پر واپس جانا پڑ سکتا ہے۔
کالم نگار کے بارے میں
رنقیان سافٹ ویئر کے بانی اور چیف سائنسدان
سنگھوا یونیورسٹی سے ماسٹر آف کمپیوٹر سائنس ، "پرنسپلز آف نون لائنر رپورٹنگ ماڈل" وغیرہ کے مصنف ، 1989 میں ، چین کی پہلی بین الاقوامی اولمپک ریاضی ٹیم کے چیمپئن رکن ، انفرادی سونے کا تمغہ 20002000 ، رنقیان کمپنی کی بنیاد رکھی؛ 2004 ، رنقیان رپورٹ میں پہلی ایک غیر لکیری رپورٹ ماڈل پیش کیا ، جو چینی طرز کے پیچیدہ رپورٹ طبع کے مسئلے کو بالکل حل کرتا ہے۔ فی الحال ، یہ ماڈل رپورٹنگ انڈسٹری میں ایک معیار بن گیا ہے 20142014 میں ، ترقی کے 7 سال بعد ، رنقیان سافٹ ویئر نے ایک حساب کتاب انجن جاری کیا جو رشتہ دار الجبرا ماڈل پر انحصار نہیں کرتا ہے۔ کیلکولیٹر ، پیچیدہ ڈھانچے والے بڑے اعداد و شمار کے حساب کتاب کی نشوونما اور کمپیوٹنگ کی کارکردگی کو مؤثر طریقے سے بہتر بنا رہا ہے 20152015 میں ، فورقس چینی ویب سائٹ کے ذریعہ رنقیان سافٹ ویئر کو "2015 فوربز چائنہ 100 ممکنہ نان درج کمپنیوں" کا نام دیا گیا تھا؛ 2016 میں ، اسے چین الیکٹرانک انفارمیشن سے نوازا گیا صنعتی ترقیاتی ریسرچ انسٹی ٹیوٹ کے ذریعہ منتخب کردہ "چین کے سافٹ ویر اور انفارمیشن سروس انڈسٹری میں 2016 ٹاپ ٹن معروف اعداد و شمار" 20172017 میں ، آزاد جدت اور ترقی کے ساتھ ڈیٹا گودام ، کلاؤڈ ڈیٹا بیس اور دیگر مصنوعات کی نئی نسل جلد لانچ کی جائے گی۔