معلومات سريعة عن تقنيات محركات البحث

ENG MUHAMED

[ADMIN]
طاقم الإدارة
25 فبراير 2008
10,079
43
48
support-ar.net
السلام عليكم


معلومات سريعة عن تقنيات محركات البحث


Search Engine Technology



الدليل (Directory) هو مجموعات من عناوين وموارد الإنترنت، مُجمَّعة وفق تصنيف مُحدد أو تندرج تحت تسمية واحدة، وتُقدم الأدلة للمستخدمين وسيلة سريعة للبدء بعمليات البحث عن المعلومات بوساطة تفحص المواضيع المُصنفة التي يعرضها، إذ يندرج تحت كل موضوع لائحة من المواضيع الفرعية التي يمكن للمُستخدم أن يتفحصها تباعاً إلى أن يصل إلى المعلومات المطلوبة، وفي حال عدم وجود المعلومات تحت الموضوع الذي اختاره المستخدم فعليه أن يتراجع ويختار موضوعاً رئيساً آخر ليقوم بالبحث في تفرعاته من جديد، وهكذا دواليك.

أما محرك البحث (بحث engine) الذي يتكون عمله من ثلاث مراحل، تبدأ الأولى مع برنامج العنكبوت
(spider) الذي يُبحر في الإنترنت لإيجاد صفحات جديدة على الويب، ويسمى هذا البرنامج أيضاً الزاحف
(crawler) لأنه يُبحر في الإنترنت لزيارة صفحات الويب والاطلاع على محتوياتها، ويأخذ هذا البرنامج مؤشرات وعناوين تلك المواقع. وتأتي بعدها مرحلة توصيف صفحات الويب المُختارة وفق مجموعة من المعايير مثل الكلمات الأكثر تكراراً من غيرها، وتُحفظ النتائج في قاعدة بيانات ضخمة. وتبدأ هنا المرحلة الأخيرة التي تميز مُحرك البحث عن الدليل، إذ يلتقط محرك البحث (search engine) الاستعلام الذي يقوم المُستخدِم بتدوينه، ويُقارنه مع قاعدة البيانات الموجودة لديه باستخدام خوارزميات المطابقة (Ranking Algorithms)، ثمَّ تُعرَض نتائج البحث المتمثلة بصفحات الويب التي تُطابق استعلام المُستخدِم. .

===============================
وهذا أيضا مقال جميل جدا حول الموضوع ....................ز


نبش أعماق الإنترنت

الرياض-أحمد عبد القادر الخالد

تعتبر عمليات البحث و إنتاج الأبحاث ثاني أكبر النشاطات على شبكة الإنترنت بعد البريد الإلكتروني. و أضحت الإنترنت ضرورة من ضرورات الحياة اليومية. فمع التطور الهائل و السريع في مجال التكنولوجيا دخلت الإنترنت إلى أغلب المنازل. و أصبح الجميع مغرما بها لما يجدونه من متعة و فائدة عند الإبحار في عالمها السحري. و لكن في الحقيقة أنه مهما بلغ مستخدم الإنترنت درجات متقدمة من المعرفة الواسعة بمحتوياتها، سيبقى بحاجة ماسة إلى من يساعده في إيجاد ضالته بين ذلك الكم الهائل من المعلومات التي تبتلعها الإنترنت في أعماقها السحيقة, ألا وهي محركات البحث بحث Engines التي تساعده في إيجاد كل ما يرغب في الحصول عليه عن طريق نبش تلك الأعماق و وضع محتوياتها المغمورة بين يديه، موفرة بذلك الوقت والجهد للوصول للمعلومة المناسبة و مجنبة إياه الوقوع في متاهات البحث.

أنواع محركات البحث:

تختلف محركات البحث في آلية عملها و مضمونها، مما دعى إلى تصنيفها حسب آلية عملها و المحتوى الذي تقدمه للمستخدم (الباحث). و سآتي هنا على ذكر أهمها.

محركات البحث الأجنبية Foreign بحث Engines: و المقصود بكلمة (أجنبية) هنا، هي تلك المحركات التي يمكنها التعامل مع لغات إضافية غير اللغة الإنكليزية، كالفرنسية و الإسبانية و غيرها. و من هذه المحركات، محرك ألتافيستا Altavista, غوغل Google, و محرك إكسايت Excite.

محركات البحث المتخصصة Specialized بحث Engines: يعتبر هذا النوع من محركات البحث ذو أهمية كبيرة خاصة على صعيد الأعمال و الأبحاث، فهنالك العديد ممن يجرون أبحاثا خاصة أو يبحثون في مسألة معينة في محركات البحث العامة، و غالبا ما يتكلفون عناء البحث للوصول إلى ما يرمون إليه. غير أن الأمر أضحى أسهل بكثير مما كان عليه سابقا بوجود مثل هذه المحركات المتخصصة. و سآتي هنا على ذكر موقع شامل و مهم جدا للباحثين على شبكة الإنترنت لما رأيت فيه من الفائدة الكبيرة,حيث يقدم محركات بحث إختصاصية رائعة في أداء عملها بشكل دقيق و هو:

www.infinisource.com/search-engines.html

محركات البحث الذكية Intelligent Agents: يجمع هذا النوع بين محركات البحث العادية و المتخصصة و ينفرد عنها بميزة هامة جدا و هي إمكانية تحميل برامج مخصصة لهذه المحركات الذكية على جهاز الكمبيوتر. و من أهمها:

نيوزروفر NewsRover: يعمل هذا البرنامج بشكل تلقائي بعد عملية إعداده. حيث يقوم باستخراج المعلومات عن طريق المجموعات الأخبارية. و يعتبر محرك مختص بعالم الأخبار الشيق بكافة تفرعاته.

إنفوماغنيت InfoMagnet: و هي من التطبيقات الذكية لمحركات البحث المتعلقة بالمجال الصناعي. و يسهل هذا البرنامج ترتيب و تصنيف نتائج البحث من خلال التقنية الذكية التي يتمتع بها.

إنفو غيت Infogate: لعله أجمل هذه التطبيقات من ناحية سهولة الإستخدام و واجهة التطبيق الرائعة و المبسطة التي يمتاز بها، فضلا عن سهولة تحميله على الكمبيوتر. و يمكنك من خلال هذا البرنامج الرائع أن تتعامل مع كافة المجالات من الأخبار و الرياضة و المال و الأعمال و غيرها من القنوات الأخرى.

المهارات التقنية للبحث على شبكة الإنترنت:

تحتاج عملية البحث على شبكة الإنترنت إلى اكتساب بعض المهارات التقينة و صقل الأسلوب التقليدي المتبع في البحث بغرض الوصول إلى المعلومات المطلوبة. حيث يدرك أغلب الباحثين أن عليهم استخدام كلمات رئيسية لإجراء بحوثهم و أنه من غير الممكن استخدام عبارات كاملة لتعطي النتيجة المطلوبة بدقة عالية. و لكن هنالك تقنيات لعملية البحث على شبكة الإنترنت و التي تغيب عن معظم المستخدمين والتي تعطي نتائج أفضل و أدق نسبيا:

البحث بالمنطق الجبري أو البوليني Bolean: و يعتمد على استخدام عبارات معينة تعمل على تحديد نتائج البحث و عدم اتساع رقعتها في جلب معلومات غير مرغوب فيها. فإذا أدرنا على سبيل المثال أن نبحث عن شخصية معينة, و ليكن مانديلا، في وضع معين أو حالة معينة نستخدم المعادلة التالية: Mandela NOT Winne وهنا تأتي نتائج البحث كل ما يخص ماندليلا ما عدا تلك التي تخصه مع زوجته ويني.

و إذا كنا نرغب بأن نحصل على نتائج تخص مانديلا في الصين نستخدم المعادلة التالية: AND China Mandela و هكذا سينتج البحث عن كل ما يخص مانديلا بالإضافة إلى كل ما يتعلق به في الصين. و من المهم جدا هنا ملاحظة الحروف الكبيرة للروابط الجبرية AND و NOT.

علاوة على ذلك، هنالك مهارات و تقنيات من نوع آخر تعطينا أيضا دقة في نتائج البحث المطلوبة و ذلك بوضع علامة (+) لربط كلمتين معا أو أكثر لنحصل على نتائج بحث أفضل. فمثلا أثناء بحثنا عن (الموقع العربي العملاق) يجب وضع إشاة (+) بين الكلمات، و ستكون نتيجة البحث كل المواقع التي وردت بها كل من الكلمات (الموقع العربي العملاق). و أيضا عند وضع كلمتين داخل أقواس التنصيص" " ففي هذه الحالة تكون نتيجة البحث هي المواقع التي وردت بها الكلمتان معا فقط.

و من ناحية أخرى، يمكننا إضافة علامة (-) لاستبعاد كلمة ما من نطاق البحث، كأن نبحث في موضوع الأسماك و لكن نستبعد منه كلمة البحرية، و بالتالي ستكون نتائج البحث عن جميع أنواع الأسماك ما عدا البحرية منها.

البحث باللغة العربية:

على الرغم من دخولنا القرن الحادي والعشرين و انتشار رقعة الإنترنت بشكل واسع إلا أننا ما زلنا نعاني في وطننا العربي من مشكلة توطين التقنيات. حيث أن معظم محتوى الإنترنت باللغة الإنكليزية، و لا تشكل اللغات الأخرى إلا جزء بسيط من ذلك المحتوى الغزير و الوفير. و السؤال الذي كان يطرح نفسه هنا هو: كيف يمكن لهؤلاء الذين لا يجيدون اللغة الإنكليزية في إجراء أبحاثهم على شبكة الإنترنت باللغة العربية؟ و لهذا عملت الكثير من الشركات على إيجاد محركات بحث تدعم اللغة العربية لإعطاء الفرصة لأكبر عدد من الناس للإستفاد من محتوى الإنترنت الهائل.

و سنتطرق هنا لبعض محركات البحث التي تدعم اللغة العربية و أهمها محرك غوغل و الذي أعطى نتائج مذهلة عند اختبار دقته بالإضافة إلى محرك أراب فيستا arabvista و الذي تحول إسمه إلى (البحار) www.albahhar.com . و طورت شركة الحمادي أيضا محرك بحث العالم العربي www.awse.com الذي تعتمد آلية البحث فيه على الدليل الرئيسي أو مربع البحث, حيث يحتوي هذا الدليل على إحدى و خمسين فئة رئيسية تحتوي بدورها على فئات فرعية بثلاث مستويات تتضمن كافة المواد و المواضيع, لتقدم بذلك المعلومة الشاملة و الدقيقة في زمن قياسي للمستخدم العربي . و من جهة أخرى تم تصنيف فئات الدليل جغرافياً حسب الدول ( عربية / غير عربية ) و ذلك لتحديد نطاق البحث .

و من محركات البحث التي تدعم اللغة العربية www.alltheweb.com , الذي يرفع شعار "كل الشبكة, طوال الوقت". حيث تمكن المعهد النروجي للتكنولوجيا أخيرا بعد عقد من الزمان أمضاه في الأبحاث, من الوصول إلى أفضل وأشمل محرك بحث على شبكة الإنترنت من وجهة نظر أغلب الباحثين. حيث يضم أكثر من 200 مليون عنوان URL في قاعدة بياناته.

إضافة إلى ذلك ظهرت على الساحة خلال السنوات الأخيرة محركات بحث عربية طورتها شركات عربية و منها محرك"نسيج" و "أين". و لا شك بأن الموقع العربي العملاق "باب"www.bab.com يقدم أكبر دليل عربي توصيفي لمجموعة مواقع يصل عددها أكثر من 10000 موقع عربي و أجنبي, مصنفة بطريقة خاصة بحيث تغطي أغلب المجالات كالدينية و العلمية و الثقافية و الرياضية و غيرها. و يعمل محرك البحث ي جميع الكلمات الموجودة في توصيف المواقع، مما يعطي دقة و خيار أشمل للبحث، فضلا عن إمكانية أيجاد الموقع المطلوب عن طريق إسمه أو عن طريق عنوانه URL، حيث أن هذه الميزة لا نجدها في كثير من محركات البحث الأخرى.
 

ENG MUHAMED

[ADMIN]
طاقم الإدارة
25 فبراير 2008
10,079
43
48
support-ar.net
تقنية محرك البحث جوجل .. اقرأ المقال

pigeon_system.jpg


The technology behind Google's great results
As a Google user, you're familiar with the speed and accuracy of a Google search. How exactly does Google manage to find the right results for every query as quickly as it does? The heart of Google's search technology is PigeonRank™, a system for ranking web pages developed by Google founders Larry Page and Sergey Brin at Stanford University.



Building upon the breakthrough work of B. F. Skinner, Page and Brin reasoned that low cost pigeon clusters (PCs) could be used to compute the relative value of web pages faster than human editors or machine-based algorithms. And while Google has dozens of engineers working to improve every aspect of our service on a daily basis, PigeonRank continues to provide the basis for all of our web search tools.

Why Google's patented PigeonRank™ works so well

PigeonRank's success relies primarily on the superior trainability of the domestic pigeon (Columba livia) and its unique capacity to recognize objects regardless of spatial orientation. The common gray pigeon can easily distinguish among items displaying only the minutest differences, an ability that enables it to select relevant web sites from among thousands of similar pages.

By collecting flocks of pigeons in dense clusters, Google is able to process search queries at speeds superior to traditional search engines, which typically rely on birds of prey, brooding hens or slow-moving waterfowl to do their relevance rankings.

When a search query is submitted to Google, it is routed to a data coop where monitors flash result pages at blazing speeds. When a relevant result is observed by one of the pigeons in the cluster, it strikes a rubber-coated steel bar with its beak, which assigns the page a PigeonRank value of one. For each peck, the PigeonRank increases. Those pages receiving the most pecks, are returned at the top of the user's results page with the other results displayed in pecking order.

Integrity

Google's pigeon-driven methods make tampering with our results extremely difficult. While some unscrupulous websites have tried to boost their ranking by including images on their pages of bread crumbs, bird seed and parrots posing seductively in resplendent plumage, Google's PigeonRank technology cannot be deceived by these techniques. A Google search is an easy, honest and objective way to find high-quality websites with information relevant to your search.

Data



PigeonRank Frequently Asked Questions

How was PigeonRank developed?

The ease of training pigeons was documented early in the annals of science and fully explored by noted psychologist B.F. Skinner, who demonstrated that with only minor incentives, pigeons could be trained to execute complex tasks such as playing ping pong, piloting bombs or revising the Abatements, Credits and Refunds section of the national tax code.

Brin and Page were the first to recognize that this adaptability could be harnessed through massively parallel pecking to solve complex problems, such as ordering large datasets or ordering pizza for large groups of engineers. Page and Brin experimented with numerous avian motivators before settling on a combination of linseed and flax (lin/ax) that not only offered superior performance, but could be gathered at no cost from nearby open space preserves. This open space lin/ax powers Google's operations to this day, and a visit to the data coop reveals pigeons happily pecking away at lin/ax kernels and seeds.

What are the challenges of operating so many pigeon clusters (PCs)?

Pigeons naturally operate in dense populations, as anyone holding a pack of peanuts in an urban plaza is aware. This compactability enables Google to pack enormous numbers of processors into small spaces, with rack after rack stacked up in our data coops. While this is optimal from the standpoint of space conservation and pigeon contentment, it does create issues during molting season, when large fans must be brought in to blow feathers out of the data coop. Removal of other pigeon byproducts was a greater challenge, until Page and Brin developed groundbreaking technology for converting poop to pixels, the tiny dots that make up a monitor's display. The clean white background of Google's home page is powered by this renewable process.

Aren't pigeons really stupid? How do they do this?

While no pigeon has actually been confirmed for a seat on the Supreme Court, pigeons are surprisingly adept at making instant judgments when confronted with difficult choices. This makes them suitable for any job requiring accurate and authoritative decision-making under pressure. Among the positions in which pigeons have served capably are replacement air traffic controllers, butterfly ballot counters and pro football referees during the "no-instant replay" years.

Where does Google get its pigeons? Some special breeding lab?

Google uses only low-cost, off-the-street pigeons for its clusters. Gathered from city parks and plazas by Google's pack of more than 50 Phds (Pigeon-harvesting dogs), the pigeons are given a quick orientation on web site relevance and assigned to an appropriate data coop.

Isn't it cruel to keep pigeons penned up in tiny data coops?

Google exceeds all international standards for the ethical treatment of its pigeon personnel. Not only are they given free range of the coop and its window ledges, special break rooms have been set up for their convenience. These rooms are stocked with an assortment of delectable seeds and grains and feature the finest in European statuary for roosting.

What's the future of pigeon computing?

Google continues to explore new applications for PigeonRank and affiliated technologies. One of the most promising projects in development involves harnessing millions of pigeons worldwide to work on complex scientific challenges. For the latest developments on Google's distributed cooing initiative, please consider signing up for our Google Friends newsletter

طبعا هذا واحد من آلاف المقالات الأجنبية حول تقنيات محركات البحث والتي يمكن الاطلاع على المزيد منها بالضغط هنا