بسم الله الرحمن الرحيم
السلام عليكم
التنقيب عن المعلومات حول كيفية عمل خوارزمية PageRank في Google ومدى تأثيرها على النتائج ،،
ماهية PageRank :
يستخدم محرك البحث Google الخوارزمية PageRank التي تحمل برائة اختراع خاصة بالسيدين Sergey Brin و Larry Page . وظهرت هذهـ الخوارزمية في المقالة :
To Anatomy Of a Large-Scale Hypertextual Web Search Engine
[ هيكلة محركات بحث الويب النصية التشعبية من المقياس الكبير ]
تعتمد هذهـ الخوارزمية على فرضية بسيطة : نقيس أهمية المقالة العلمية بعدد المراجع إلى هذهـ المقالة . ونقل السيدان Brin و Page هذهـ الفرضية إلى عالم الويب : إمكانية قياس أهمية صفحة الويب من خلال إحصاء عدد الارتباطات التشعبية التي تؤشر إليها .
ماهية الخوارزمية :
تتمحور خورزمية PageRank حول المعادلة الرياضية التالية :
حيث
مغزى هذهـ المعادلة ؟
لننظر إلى هذهـ المعادلة من وجهة نظر محرك البحث : هناك طريقتان لتأثير PageRank في ترتيب الصفحات في Google :
عدد الارتباطات القادمة ، ويتحسن ترتيب الصفحة لدى ازدياد هذا العدد : يضيف كل ارتباط حداً موجباً في المعادلة السابقة . إذاً ، لايمكن أن يحمل الارتباط الجديد أي تأثير سلبي .
العدد الكلي للارتباطات الصادرة من الصفحات التي تؤشر إلى الصفحة A : من الأفضل أن يكون هذا العدد اقل مايمكن .
لنفترض وجود صفحتين تملكان نفس ترتيب PageRank وتؤشران إلى الصفحة A وتمتلك إحدى الصفحتين خمسة ارتباطات صادرة ، بينما تتضمن الصفحة الثانية عشرة ارتباطات صادرة . سنلاحظ ان للصفحة الأولى ضعف التأثير الأيجابي الذي تقدمه الصفحة الثانية في ترتيب PageRank للصفحة A .
فائدة حساب PageRank
هناك مقاومة جيدة في PageRank لمحاولات تجميع الارتباطات ، فقيمة PageRank تبقى ثابته خلال العمليات الحسابية ، لنفرض أن لصفحة الويب قيمة PageRank مساوية لـ 4 ، وتتضمن هذهـ الصفحة ارتباطين خارجين إلى صفحتين في هذهـ الحالة ستحصل كل صفحة على وحدتين من PageRank .
لنفرض أن قيمة PageRank تساوي الواحد من أجل كل صفحة ويب في بداية وجودها في فهرس Google . وهكذا يزداد مجموع PageRank للموقع عند ازدياد عدد صفحات الويب فيه ، فإن احتوى الموقع على عشر صفحات ويب فسيحصل في البداية على عشرة وحدات في PageRank ، ثم تتقاسم صفحات الموقع هذه الوحدات من خلال الارتباطات التشعيبية . كما يبدأ الموقع بالقيمة PageRank12 عند احتوائه 12 صفحة .
مجملاً ، نسنتنج امكانية تحسين قيمة PageRank للموقع ككل من خلال انشاء محتويات جديدة [ أي المزيد من الصفحات ] ، ثم نتحكم بتوزيع قيمة PageRank الكلية للموقع بواسطة ترابطات داخلية مدروسة بين مختلف الموقع .
أتمنى أن يحوز الدرس على رضاكم
السلام عليكم
التنقيب عن المعلومات حول كيفية عمل خوارزمية PageRank في Google ومدى تأثيرها على النتائج ،،
ماهية PageRank :
يستخدم محرك البحث Google الخوارزمية PageRank التي تحمل برائة اختراع خاصة بالسيدين Sergey Brin و Larry Page . وظهرت هذهـ الخوارزمية في المقالة :
To Anatomy Of a Large-Scale Hypertextual Web Search Engine
[ هيكلة محركات بحث الويب النصية التشعبية من المقياس الكبير ]
تعتمد هذهـ الخوارزمية على فرضية بسيطة : نقيس أهمية المقالة العلمية بعدد المراجع إلى هذهـ المقالة . ونقل السيدان Brin و Page هذهـ الفرضية إلى عالم الويب : إمكانية قياس أهمية صفحة الويب من خلال إحصاء عدد الارتباطات التشعبية التي تؤشر إليها .
ماهية الخوارزمية :
تتمحور خورزمية PageRank حول المعادلة الرياضية التالية :
حيث
- PR(A) قيمة PageRank من أجل الصفحة A
- PR(T1) قيمة PageRank من أجل الصفحة T1
- C(T1) عدد الارتباطات الخارجة من الصفحة T1
- d عامل ثقيل موجود في المجال ]1..0[ ( أي أن 0<d<1 ) , ويأخذ d عادة القيمة 0.85
- n عدد الارتباطات الواردة إلى الصفحة A
مغزى هذهـ المعادلة ؟
لننظر إلى هذهـ المعادلة من وجهة نظر محرك البحث : هناك طريقتان لتأثير PageRank في ترتيب الصفحات في Google :
عدد الارتباطات القادمة ، ويتحسن ترتيب الصفحة لدى ازدياد هذا العدد : يضيف كل ارتباط حداً موجباً في المعادلة السابقة . إذاً ، لايمكن أن يحمل الارتباط الجديد أي تأثير سلبي .
العدد الكلي للارتباطات الصادرة من الصفحات التي تؤشر إلى الصفحة A : من الأفضل أن يكون هذا العدد اقل مايمكن .
لنفترض وجود صفحتين تملكان نفس ترتيب PageRank وتؤشران إلى الصفحة A وتمتلك إحدى الصفحتين خمسة ارتباطات صادرة ، بينما تتضمن الصفحة الثانية عشرة ارتباطات صادرة . سنلاحظ ان للصفحة الأولى ضعف التأثير الأيجابي الذي تقدمه الصفحة الثانية في ترتيب PageRank للصفحة A .
فائدة حساب PageRank
هناك مقاومة جيدة في PageRank لمحاولات تجميع الارتباطات ، فقيمة PageRank تبقى ثابته خلال العمليات الحسابية ، لنفرض أن لصفحة الويب قيمة PageRank مساوية لـ 4 ، وتتضمن هذهـ الصفحة ارتباطين خارجين إلى صفحتين في هذهـ الحالة ستحصل كل صفحة على وحدتين من PageRank .
لنفرض أن قيمة PageRank تساوي الواحد من أجل كل صفحة ويب في بداية وجودها في فهرس Google . وهكذا يزداد مجموع PageRank للموقع عند ازدياد عدد صفحات الويب فيه ، فإن احتوى الموقع على عشر صفحات ويب فسيحصل في البداية على عشرة وحدات في PageRank ، ثم تتقاسم صفحات الموقع هذه الوحدات من خلال الارتباطات التشعيبية . كما يبدأ الموقع بالقيمة PageRank12 عند احتوائه 12 صفحة .
مجملاً ، نسنتنج امكانية تحسين قيمة PageRank للموقع ككل من خلال انشاء محتويات جديدة [ أي المزيد من الصفحات ] ، ثم نتحكم بتوزيع قيمة PageRank الكلية للموقع بواسطة ترابطات داخلية مدروسة بين مختلف الموقع .
أتمنى أن يحوز الدرس على رضاكم