الكامنة الفهرسة الدلالي: كيف يعمل LSI خوارزمية؟

فهرسة الدلالات الكامنة، أو الخوارزمية LSI، هي وسيلة جوجل للتغلب على الاستخدام المفرط للكلمات. تعلم كيف يعمل LSI والسبب في ذلك هو مفيد للغاية.

A+ A-

تستخدم Google LSI لتقييم معنى محتوى مكتوب على بلوق الخاص بك أو الموقع. فهرسة الدلالات الكامنة هي تسمية خاطئة عن "التحليل الدلالي كامنة"، وهي تقنية تحليلية إحصائية التي يمكن استخدامها سلاسل الأحرف لتحديد دلالات النص - ما أن النص يعني في الواقع.

الفهرسة الدلالي الكامنة

هنا سنناقش بعض جوانب LSI التي تجعلك تفكر بطريقة مختلفة عن الكلمات الرئيسية وكيفية كتابة المحتوى الخاص بك. نضع في اعتبارنا أن جوجل هو أكبر في حركة البحث فإنه يحصل أن جميع محركات البحث الأخرى مجتمعة. أيضا، بعض من هؤلاء الآخرين استخدام بيانات Google. وهذا هو السبب في أننا نركز على ذلك.

ما هو فهرسة الدلالات الكامنة؟

هدف جوجل هو لتقدم لعملائها أفضل المعلومات التي يمكن عندما يقومون بعملية تفتيش. لذلك يجب فهم جوجل تماما بالضبط ما باحثين المعلومات التي تبحث عنها عندما تستخدم كلمات رئيسية للحصول على معلومات، وكذلك مدى توفر كل صفحة الويب المفهرسة تلك المعلومات.

وقد وضعت الكامنة الفهرسة الدلالي (LSI) خوارزمية جوجل لاستخدام سلاسل الأحرف في وثيقة لتأسيس أهميتها الدلالية لمصطلح البحث (الكلمة) المستخدمة. وبعبارة أخرى، للمساعدة في إنشاء المعنى الحقيقي للنص على بلوق وظيفة أو صفحة على شبكة الإنترنت.

تعتبر الخوارزمية LSI جميع المصطلحات المكونة المستخدمة في نص وثيقة لإثبات المعنى الحقيقي لها فيما يتعلق الكلمات الرئيسية المستخدمة. هذا هو السبب في أنه من المهم أن تكون محددة عند البحث عن المعلومات على جوجل. إذا كنت تستخدم كلمة "أباتشي" كمصطلح بحث في جوجل، وتشمل النتائج الأولى ستة الخاصة بك تطبيق خادم الويب، قبيلة الأمريكية الأصلية، ومروحيات اباتشي وشركة التنقيب عن النفط والغاز باستخدام هذا الاسم.

لا نستطيع أن نفترض أن جوجل سيعود نفس التعريف لمصطلح البحث كما كنت تفكر. يجب أن لا تستخدم فقط الكلمة الرئيسية الخاصة بك، ولكن تحديد تعريف لها فيما يتعلق استخدامك لها.

أباتشي - صفحة Google نتائج البحث

وبنفس الطريقة، إذا كنت تستخدم مفهوم LSI في النص الخاص بك، ثم يمكنك زيادة القدرة على صفحتك أو بلوق وظيفة لتكون مدرجة لهذا المصطلح البحث في السياق الذي تستخدم فيه. هذا صحيح، حتى لو كان النص على صفحة الويب الخاصة بك أو بلوق وظيفة لا تذكر الكلمة "اباتشي" - أو أي الكلمة الأخرى التي تستخدم. هنا هو لماذا.

LSI ينطوي تحليل سلسلة الأحرف

الخوارزمية لا يستخدم القاموس كما نعرفها، لكنه ينطوي على التحليل الإحصائي ورياضية معقدة من الشخصيات الفردية وسلاسل الأحرف المستخدمة في النص التي تشكل صفحة ويب معينة. ولا يهم ما إذا كان هذا هو صفحة بلوق، وظيفة، صفحة كاملة على موقع على الانترنت أو حتى تعليق آخر أو منتدى السلسلة. يستخدم LSI لتقييم محتوى أي ملف فردي نشرت على شبكة الإنترنت.

وبسبب هذا، وقد أدخلت جوجل وسيلة قوية جدا التمييز بين اللغة والمفردات ومعاني الكلمات. كيف يمكن لهذه تختلف؟ وإليك الطريقة:

اللغة: كلمة عادة ما يشير إلى أشكال من الكلمات المكتوبة أو المنطوقة محددة لبلد أو مجتمع معين. وهكذا، فإن سلسلة نصية "ألم" تعني "الخبز" في الفرنسية، ولكن ليس في اللغة الإنجليزية. جوجل لا يمكن معرفة الفرق ما لم يفهم اللغة المستخدمة.

المفردات: هذه الكلمة تشير إلى الكلمات المستخدمة في لغة معينة. ويمكن أيضا الرجوع إلى مجموعة من الكلمات المعروفة من قبل شخص معين داخل اللغة. يشير مصطلح "لغة سيئة على استخدام المفردات وليس اللغة. 'صندوق' هو كلمة في المفردات الإنجليزية، إلا أن الكلمة لها معان كثيرة، مما يؤدي بنا إلى:

دلالات: نفس الكلمة يمكن أن تستخدم لتعني أشياء كثيرة. وهكذا فإن كلمة "مربع" يمكن أن تعني وعاء، للقتال، لتلاوة نقاط البوصلة أو نوع من الأدغال. دلالات تشير إلى معنى الكلمات في سياق محدد. لغة سيئة يمكن أن تعبر عن حسن النية جدا - لذلك قد تشكل دلالات فعالة!

بناء الجملة: إن الطريقة التي يتم الجمع بين الكلمات في الجملة. وهكذا، فإن عبارة "الكلب عض الرجل يمكن التعبير عنها باستخدام بناء الجملة مختلفة مثل" الرجل عض الكلب. 'قبل LSI جوجل لا يمكن تمييز الفرق - انها مجرد الكشف عن الكلمات.

LSI خوارزمية جوجل تأخذ كل هذه العوامل في الاعتبار. إذا كنت تعتقد عميقا بما فيه الكفاية، وسوف تكون قادرة على فهم لماذا تكرار الكلمة لا معنى لها، والسبب في انخفاض كثافة الكلمة (د) يمكن أن توفر لك مع نتائج ترتيب أفضل من دينار عالية.

خوارزمية تحلل معنى الكلمات في صفحة الويب الخاصة بك أو بلوق باستخدام دلالات وبناء الجملة، وتطابق هذه مع المعنى ينظر من الكلمات الرئيسية المستخدمة من قبل الشخص تنفيذ البحث.

الكلمة أو معنى؟

ما هو أكثر أهمية لقرائك؟ كلمات أو معنى؟ دعونا نقول كنت تبحث عن معلومات على الإنترنت باستخدام محرك البحث. ما تفضل أن تجد: صفحة التي تقدم الكثير من التكرار من الكلمات الرئيسية الخاصة بك، ولكن القليل جدا آخر، أو واحد أن يوفر لك ما كنت تبحث عنه، حتى لو كنت لا يمكن العثور على مصطلح البحث في النص؟

كنت تعرف الجواب على ذلك، وهكذا يفعل جوجل. كانت المشكلة، وذلك في الأيام الأولى من وجودها، وكان محرك البحث جوجل قادرة على العثور على وفهرسته وتصنيفه فقط أولئك صفحات الويب التي تحتوي على مصطلح البحث (الكلمة / العبارة) المستخدمة من قبل أولئك الذين يسعون من المعلومات.

إذا لم تحتوي على آخر بلوق الخاص بك أو صفحة ويب العبارة الرئيسية المستخدمة في البحث على المدى عدة مرات، فإنه لن يتم سرد وجعل مرئية إلى أي شخص باستخدام هذه العبارة - في المستقبل نشير إلى كلمات بأنها كلمة واحدة أو عدة. حتى تخمين ما!

حشو الكلمات الرئيسية والبرامج

أصبح ممارسة شائعة لصفحات الويب الاشياء كاملة من الكلمات الرئيسية. أكثر مرحا، وسوف جوجل تصنيفها عاليا في صفحة نتائج لتلك الكلمة الرئيسية. جعلت رجال الأعمال ثرواتهم من خلال تصميم البرامج (التطبيقات لك الشباب) التي من شأنها أن تأخذ صفحة واحدة من النص وتوليد مئات آخرين، وتغيير أي شيء ولكن الكلمة المستخدمة لهذه الصفحة.

يجري عرض كثير من الناس أن تستخدم محرك البحث للعثور على ما كان لهم معلومات هامة جدا، مع الصفحة على صفحة من الهراء عديمة الفائدة التي أعطت لهم سوى الاعلانات وتكرار نفس الأشياء مرارا وتكرارا.

وشكا حتى أصحاب المواقع لجوجل حول الكيفية التي يمكن أن تدرج هذه الصفحات أعلى من تلك التي كانت تقدم حقيقي من المعلومات. كان السبب، بالطبع، تكرار الكلمات الرئيسية. وكانت الطريقة التي تم بها تعيين خوارزمية الترتيب حتى أن أكثر من الكلمات الرئيسية، وارتفاع الترتيب. وكان لهذا أن يتوقف.

رصدت Google هذا، ولذا قررت أن تفعل شيئا حيال ذلك، ولكن ماذا؟ وقد بدأت باستخدام خوارزمية ادسنس التي كانت دلالات لإقامة أفضل نوع من الإعلانات عن أي صفحة ويب معينة. وتطورت هذه الفكرة أبعد من ذلك، باستخدام التحليل الدلالي كامنة لإنشاء الكامنة خوارزمية فهرسة الدلالات. المزيد عن هذا قريبا.

يستخدم LSI مفهوم التحليل الدلالي كامنة لمسح جميع المفردات، بناء الجملة ودلالات على صفحة لإنشاء معناها الحقيقي. عن طريق التكامل الواسع النطاق، يمكن أن جوجل مقارنة مصطلح البحث المستخدمة من قبل العملاء مع صفحات الويب المفهرسة وتحديد أي أفضل المباريات التي مصطلح البحث / الكلمة من خلال تحليل كل المفردات على الصفحة، وليس الكلمات الرئيسية فقط. كيف يفعل ذلك؟

المشكلة من الغموض في اللغة والمفردات

دعونا نقول لكم ان نكتب كتابا عن اختراع واستخدام الأقفال على مر التاريخ. كنت بحاجة الى بعض المعلومات على الانترنت حول هذا الموضوع، لذلك قمت بإدخال مصطلح البحث "الأقفال وتاريخهم". أو ربما، "تاريخ الأقفال."

إن السؤال الأول للنظر أن "ما هو نوع من الأقفال؟" هل الكتابة عن تأمين الأمن - الأقفال والمفاتيح، أو عن اقفال القناة؟ أو ربما كنت حتى في اشارة الى خصلات الشعر؟ بالنسبة لمعظم الناس، إلا أن الخيارين الأولين سيكون على الأرجح - أقفال قناة أو تلك التي تحتاج إلى مفاتيح لفتح.

لجوجل، ولكن كل هي نفسها. الكلمة هي "أقفال" أو حتى "تاريخ الأقفال 'ولكن كيف يمكن للآلة تعرف ما الذي تتحدث عنه؟ لا يمكن أن أطلب منكم - كل ما يمكن القيام به هو اتخاذ سلسلة الأحرف التي تشكل الكلمات، والبحث عنه ضمن نطاق بلوق وظائف فهرستها وصفحات الويب.

تأثير اقتناء الدلالة التطبيقية

جاء الجواب بعد شراء جوجل لشركة سانتا مونيكا في عام 2003 يعرف باسم علم الدلالة التطبيقية. وهذه الشركة تعمل على الخوارزميات التي تطبق دلالات لفهم المعنى الحقيقي للنص المكتوب. اشترت جوجل شركة ومن ثم تطبيق مبادئه لبرنامج ادسنس لها.

هذا هو البرنامج المذكور في وقت سابق، حيث يضع جوجل ذات الصلة إعلانات PPC على صفحات الويب الخاصة بك. واستخدمت مبادئ علم الدلالة التطبيقية لإنشاء أفضل نوع من الإعلان عن صفحتك، استنادا إلى التركيز الحقيقي لمضمونه.

واصلت جوجل تطوير هذه التقنية التحليلية الرياضية، وجاء أخيرا مع ما يشار إليها باسم الفهرسة الدلالي الكامنة. باستخدام LSI، فمن الممكن لجوجل لمؤشر ثم رتبة صفحتك لمعناها ومحتواها الكلي بدلا من التركيز على استخدامه فقط من الكلمات الرئيسية.

كيف LSI خوارزمية العمل: كلمات ومعاني الكلمات؟

جوجل سوف ننظر في المفردات الأخرى على الصفحة الخاصة بك ثم إجراء التحليل الإحصائي للسياق وبنية مثل هذه المفردات. إذا يبحث مستخدم جوجل عن "تاريخ أقفال الأمان" ثم جوجل سوف تأخذ مفردات أخرى من صفحاته فهرستها في الاعتبار. إذا صفحتك تحتوي على كلمات مثل 'مفاتيح' 'العتلات،' و 'أبواب' بعد ذلك سوف ربط هذه المفردات مع أقفال الأمن.

وبعد أخذ عوامل أخرى في الاعتبار الترتيب، فإنه سيتم ثم قائمة صفحتك في صفحات نتائج البحث عن هذه الكلمة (تاريخ أقفال الأمان) مرتبة حسب الفوائد التي تعود على جوجل تعتقد أنها على توفيرها بغية الباحث. قبل LSI، كما سيتم منح الباحث صفحات التركيز على تأمين القناة وحتى على الشعر.

تجنب كلمات الحشوة

نقطة الوجود كله جعل هنا هو أن لم يعد هناك حاجة لتكرار المفرط للكلمات. منذ أن أطلقت جوجل LSI، كل ما عليك القيام به هو التأكد من أن استخدام العديد من المرادفات والمصطلحات ذات الصلة ما تستطيع إلى الكلمة التي مطاردة.

ولكن لا يحصل لنا خطأ - كلمات لا يزال العد. يجب الاستمرار في استخدام الكلمات الرئيسية ذات الصلة، ولكن جوجل يستخدم مفهوم التكامل الواسع النطاق لتحديد ما هي محتوى الموقع هو حقا عن: ما الذي يقوله حقا. ذلك هو اللحاق بها صفحات مكتوبة خصيصا للحصول على قائمة للكلمات الرئيسية الفردية، ولكن أن يكون محتوى مفيد تذكر سوى تكرار لا معنى للكلمة.

لا يزال بإمكانك استخدامها، على الرغم من أن حتى 1.5٪ دينار أو أقل سوف تكون كافية تماما. استخدام الكلمات الرئيسية لماما، وأيضا استخدام مصطلحات أخرى تعني الشيء نفسه في سياق مكانة الخاصة بك. هذا هو الجواب على سؤالك - كيف يمكن للLSI خوارزمية العمل - ولماذا فهرسة الدلالات الكامنة هو مصطلح لا تحتاج إلى تذكر ما دمت فهم وتطبيق مفاهيم تستخدم جوجل عندما توظف LSI في الفهرسة وخوارزميات الترتيب.

Ads

شارك

الأخيرة

أفضل البدائل أوبونتو للبحث عن إذا كنت لينكس العشاق

دعونا نبدأ عن طريق الحصول على دراية شيء. الأساسية ولكن قليل...

كيفية إضافة التوقيع في علبة بريد جوجل - إضافة التوقيع جوجل في Gmail

وكان صندوق البريد الوارد من قبل جوجل واحدة من أفضل الأمور ق...

أسبوعية أخبار تكنولوجيا المعلومات: نوكيا وغوغل ونينتندو

مرحبا بالجميع، انها الجمعة 3 مارس وتماما مثل دائما نعود مع ...

مشاريع بي التوت للمبتدئين - ماذا يمكن أن تفعل مع التوت بي

التوت بي هو عبارة عن سلسلة من الطاقة المنخفضة، وأجهزة الكمب...

أفضل VPN لالروبوت 2017 - كيفية استخدام VPN في الروبوت

لقد ولت الأيام التي كانت فيها الشبكات الخاصة الإفتراضية فقط...

تعليقات