সার্চ ইঞ্জিন কি এবং কিভাবে কাজ করে?   

what_is_seo_techvilla24

বর্তমানে ইন্টারনেট ব্যবহার কারিদের মধ্য সার্চ ইঞ্জিনের নাম শোনানি বা সার্চ ইঞ্জিন ব্যবহার করেনি এমন মানুষ খুজে পাওয়া সত্যিয়ই খুব দূষকর । কেননা ইন্টারনেটে কোন তথ্য  অনুসন্ধানের জন্য আমরা প্রতিনিয়তই কোন না কোন ভাবে – Search Engine এর উপর নির্ভরশীল হতে হয় যা বলার অবকাশ রাখে না। আমরা এখন হর- হামেশাই কম বেশি সবাই স্মার্ট ফোন ব্যবহার করে থাকি যারা কোন তথ্য খুঁজে পাওয়ার জন্য গুগল সার্চ করে থাকি । আর এই গুগল হলো একটি সার্চ ইঞ্জিন। ইন্টারনেট জুড়ে এরকম আরও অনেক সার্চ ইঞ্জিন রয়েছে।  

তবে একটি সার্চ ইঞ্জিন কিভাবে সঠিক ভাবে কাজ করে তার ব্যপারে আমরা অনেকেই এখনো অবগত না । তাই আমরা যারা এই ব্যপারে জানতে অনেক আগ্রহী তাদের জন্যই আজকের এই বিস্তারিত আলোচলনা । আমাদের আজকের আলোচলনার বিষয় বস্তু হচ্ছে –  search engine কি এবং কত প্রকার, এটি কিভাবে কাজ করে এবং এর কাজ কি সহ আরও গুরুত্বপূর্ণ কিছু বিষয়াদি নিয়ে। প্রথমেই সার্চ ইঞ্জিন কি ? তা নিয়ে নিচে আলোচলনা করা গেল ।   

সার্চ ইঞ্জিন হলো একপ্রকার  সফটওয়্যার প্রোগ্রাম (Software Program)  অথবা অনলাইন টুল (Online Tool)  যেটি একজন ব্যবহারকারীকে  ইন্টারনেট থেকে প্রয়োজনীয় তথ্য খুঁজে বের করতে সাহায্য করে।    

সার্চ ইঞ্জিন ইন্টারনেটের তার তথ্য ভান্ডার থেকে একজন ইউজার কর্তৃক অনুসন্ধানকৃত প্রশ্নের কীওয়াড  অথবা সার্চ রেজাল্ট এর  সাথে সামঞ্জস্য পূর্ণ তথ্য ও তথ্যের সাথে জড়িত কন্টেন্টগুলোর ওয়েবসাইটের লিংক একটি search engine result page (SERP) এর মধ্যে প্রদর্শন করে।    

 এই ধরণের কন্টেন্ট এর মধ্যে রয়েছে বিভিন্ন ধরনের টেক্সট রিলেটেড কন্টেন্ট , আর্টিকেল , ছবি, অডিও, ভিডিও এবং অন্যান্য প্রায় সব ধরনের মিডিয়া কন্টেন্ট। 

যার মধ্য থেকে একজন ব্যবহারকারি তার সব থেকে প্রাসঙ্গিক বিষয়টি খুব খুজে বের করতে পারে।   

প্রায় সব ধরণের সার্চ ইঞ্জিনের রয়েছে নিজস্ব এক বিশাল তথ্য ভাণ্ডার। যার মধ্য রয়েছে বিলিয়ন ওয়েব পেজ এর সমাহার। ওয়েব পেজ গুলোর এই বিশাল তথ্য ভাণ্ডার থেকেই 

মূলত সার্চ ইঞ্জিন আমাদেরকে আমাদের কাঙ্গিত তথ্যটি সরবরাহ করে  থাকে।  সার্চ ইঞ্জিনে আমরা যখন আমরা কোন তথ্য সার্চ করে থাকি তখন সার্চ ইঞ্জিন তার কিছু অ্যালগরিদম (algorithm) -এর মাধ্যমে ঐ query-এর মিল রয়েছে এরূপ তথ্য তার তথ্য ভাণ্ডার থেকে খুঁজে বের করে এবং তৎক্ষনাৎ ঐ তথ্যগুলো আমরা search engine result page -এর মাধ্যমে দেখতে পাই।   

World Wide Web (WWW) এর মাধ্যমে মূলত সার্চ ইঞ্জিন তথ্য অনুসন্ধানের এই কাজটি করে থাকে। এর মাধ্যমে ব্যবহারকারির query থেকে কিছু নির্দিষ্ট keywords এবং বিশেষ কিছু ক্ষেত্রে phrase এর ওপর বিচার বিশ্লষণ করে এর সাথে সবথেকে বেশি সামঞ্জস্য রয়েছে এমন তথ্যের যে লিংকগুলো বা ওয়েভ রয়েছে সেগুলো সার্চ রেজাল্ট পেজের উপর দিক থেকে ধারাবাহিক ভাবে সাজানো হয়ে থাকে এবং ইউজার ঐ লিংকগুলো থেকে সেই পেজগুলোতে ভিজিট করতে পারেন। সুতরাং “সার্চ ইঞ্জিন হলো ইন্টারনেট থেকে তথ্য খুঁজে বের করার একটি প্রোগ্রাম অথবা সফটওয়্যার যেটি খুব অল্প সময়ের ভেতরে ইন্টারনেট থেকে যেকোন ধরনের তথ্য খুঁজে পেতে সাহায্য করে।”   

কিভাবে সার্চ ইঞ্জিন কাজ করে? 

সার্চ বারে আমরা যখন কোন কিওয়ার্ড দিয়ে সার্চ করে থাকি তখন আমাদের সার্চ রিলেটেড কিওয়ার্ডটির সাথে মিল রয়েছে এমন সব ওয়েব পেজের লিংক সার্চ রেজাল্ট পেজের মাধ্যমে প্রদর্শিত হয়।   

সার্চ ইঞ্জিন তার সমগ্র এই কাজটিকে প্রধানত দুই ভাগে ভাগ করে থাকে ।  

  • তথ্য সংগ্রহ ও সন্নিবেশ  
  • তথ্য উপস্থাপন বা ফলাফল প্রদান 

তথ্য সংগ্রহ ও সন্নিবেশ 

ইন্টারনেটের বেশিরভাগ সার্চ ইঞ্জিন মূলত প্রধান তিনটি ধাপ অনুসরণ করার মাধ্যমে যাবতীয় তথ্য সংগ্রহ করে থাকে। ধাপগুলো হলো: 

  • Crawling 
  • Indexing 
  • Ranking 

Crawling 

সার্চ ইঞ্জিন প্রধান কাজটির নাম হলো ক্রলিং (crawling). এ কাজের জন্য প্রতিটি search engine এর রয়েছে নির্দিষ্ট কিছু  সেট করা প্রোগ্রাম (programs) যেগুলোকে ইন্টারনেটের ভাষায় বট (bots), স্পাইডার্স (spiders) অথবা ক্রলার্স (crawlers) বলা হয়ে থাকে। এই  crawlers গুলোর কাজ হলো ওয়ার্ল্ড ওয়াইড ওয়েব (www)  – এর মাধ্যমে ইন্টারনেটে ছড়িয়ে থাকা অসংখ্য ওয়েবসাইট গুলোতে ভিজিট করে যেগুলোকে স্ক্যান (scan) করা এবং সেখান হতে যাবতীয় তথ্য সংগ্রহ করে সার্চ ইঞ্জিনের ডাটাবেজে জমা রাখা।  

কন্টেন্ট এর মধ্যে থাকা লিংকের মাধ্যমে crawlers – একটির পর একটি ওয়েবসাইট স্ক্যানিং করে বেড়ায়। এসব ওয়েবসাইট থেকে title, description, keywords, images, videos, texts, external এবং internal links সহ আরও অন্যান্য তথ্যাদি সংগ্রহ করে সেগুলো ইঞ্জিনের নির্ধারিত ডাটাবেজে সংরক্ষণ করে। আর যখন আমরা সার্চ ইঞ্জিনে কোন কিছু সার্চ করি তখন সার্চ ইঞ্জিন তার নির্ধারিত ডাটাবেজে জমাকৃত এসব তথ্য থেকেই আমাদের তথ্য প্রদান করে থাকে।  

Indexing 

 সার্চ ইঞ্জিনের  দ্বিতীয় ধাপটি হলো indexing. এক্ষেত্রে একটি ক্রলার্স (crawlers) যখন কোন ওয়েবসাইট স্ক্যান করে তখন সেখানকার ওয়েব পেজগুলোর  লিংক ইনডেক্সার-index  অ্যালগরিদমের (algorithm) মাধ্যমে ইনডেক্স বা জমা করে রাখা হয়। অর্থাৎ ওয়েব পেজগুলোর ক্যাটাগরি এবং keywords এর উপর ভিত্তি করে এসব পেজের লিংক ও অন্যান্য তথ্যাদি সার্চ ইঞ্জিনের ডাটাবেজে সাজিয়ে রাখার কাজটিকে-ই মূলত বলা হয় indexing.  

অথাৎ সার্চ ইঞ্জিন  ইউজারের query পাওয়ার সাথে সাথেই তার নির্দিষ্ট স্থান থেকে তথ্যটি সংগ্রহ করে নিয়ে আসতে পারে এবং প্রদর্শন করে থাকে।  আর এই কাজটি সহজে করার জন্য সার্চ ইঞ্জিন তার প্রত্যকটি তথ্য বা ডাটাকে কিছু প্রোগ্রাম এর মাধ্যমে সেট করে থাকে যাকে সার্চ ইঞ্জিন এর ভাষায় Indexing  (Indexing) ইনডেক্সিং বলা হয় ।  

Ranking 

ইনডেক্সিং এর পর সার্চ ইঞ্জিন ranking এর মাধ্যমে ওয়েবসাইটগুলোকে ক্রমাগত সাজাতে থাকে। অথাৎ যখন কোন ইউজার সার্চ বারে কোন কিছু লিখে সার্চ করবে তখন ঐ keywords এর ভিত্তিতে কোন কোন ওয়েবসাইট এর লিংক সার্চ ইঞ্জিন রেজাল্ট পেজ (Search Engine results page) এ দেখানো হবে সেই ওয়েবসাইট গুলোর লিংকের একটি ক্রম বা (ranking) তৈরি করে।    

এছাড়া একটি নির্দিষ্ট কিওয়ার্ড এর বিপরীতে যে কয়টি ওয়েব পেজের লিংক সার্চ রেজাল্ট বক্সে প্রদর্শন করা হবে তারও একটি ক্রম এই ranking প্রোগ্রামের মাধ্যমে আগে থেকেই তৈরি করে রাখা হয়, যাকে আমরা রিলেটেড সার্চ ও বলে থাকি। যদিও এটি একটি অনেক জটিল প্রোগ্রাম, এর লক্ষ্য হলো ইউজারকে সহজেই ইন্টারনেট থেকে কোন তথ্য খুঁজে পেতে সাহায্য করা।  

সার্চ ইঞ্জিন কত প্রকার? 

সার্চ ইঞ্জিন প্রধানত ৪ ধরনের। যথা- 

Crawler Search Engine 

এই ধরণের সার্চ ইঞ্জিন সাধারণত search engine crawler এবং indexer ব্যবহার করে এবং ranking এর মাধ্যমে ওয়েবসাইট গুলোকে rank করে সে সকল ইঞ্জিনকে মূলত ক্রলার সার্চ ইঞ্জিন বলা হয়। যেমন কিছু ক্রলার সার্চ ইঞ্জিনের উদাহরণ হলো:  

  • Google 
  • Yahoo 
  • Yandex 
  • Ask 

Web Directories 

ডিরেক্টরি সিস্টেম ব্যবহার করে যে সকল সার্চ ইঞ্জিন ওয়েবসাইটের লিংক সংগ্রহ করে এবং তথ্য লিপিবদ্ধ করে অর্থাৎ কোন বট বা ইনডেক্সার  (index) ব্যবহার করে না তাদের ওয়েব ডিরেক্টরি (Web Directories) সার্চ ইঞ্জিন বলা হয়। এই ধরনের ইঞ্জিনগুলো মূলত ক্রলার ইঞ্জিনগুলোর একদম বিপরীত। কেননা এক্ষেত্রে কোন সার্চ ইঞ্জিন বট (Search engine bots) ওয়েবসাইটে ঘুরে ঘুরে তথ্য সংগ্রহ করে না। বরং ওয়েবসাইটের স্বত্বাধিকারীকেই তার ওয়েবসাইটের লিংক ওয়েব ডিরেক্টরিতে জমা দিতে হয় এবং ক্যাটাগরি অনুযায়ী সঠিকভাবে সাজাতে হয়।  

এ ধরনের সার্চ ইঞ্জিনগুলোর মধ্যে রয়েছে: 

  • Yahoo Directory  
  • 9sites  
  • Blogarama 
  • A1webdirectory 
     

Hybrid Search Engine 

এই ধরনের সার্চ ইঞ্জিনগুলো সাধারণত ক্রলার (crawler) এবং ডিরেক্টরি (directory) দুই ধরনের সিস্টেম মেইনটেইন করে পরিচালিত হয়। তবে একসময় ওয়েব ডিরেক্টরি বেশ জনপ্রিয় থাকার কারণে এ ধরনের ইঞ্জিনের অনেক প্রচলন ছিল। কিন্তু এখন ক্রলিং এবং ইনডেক্সিং অধিক জনপ্রিয় হওয়ার কারণে হাইব্রিড ইঞ্জিনগুলো ধীরে ধীরে শুধুমাত্র ক্রলার ইঞ্জিনে রূপান্তরিত হচ্ছে।  

যেমন-  

  • Google 
  • Yahoo 

Meta SearEngine 

মেটা সার্চ ইঞ্জিন অনন্য সার্চ ইঞ্জিন থেকে কিছুটা ভিন্ন কারণ এদের নিজস্ব কোন ডাটাবেজ (database) । এই ইঞ্জিন গুলো অন্যান্য ইঞ্জিনের কীওয়াড এর উপর ভিত্তি করে সেই তথ্য নিজস্ব অ্যালগরিদম ব্যবহার করে রেজাল্ট পেজে প্রদর্শন করে। 

এরূপ কিছু সার্চ ইঞ্জিনের নাম হলো: 

  • Metacrawler 
  • Dogpile  

সার্চ ইঞ্জিন সম্পর্কিত আরো বিস্তারিত আলোচলনা আমাদের উক্ত ব্লগ সাইটে করা হবে,তাই নিয়মিত আমাদের ওয়েবসাইটে ভিসিট করার মাধ্যমে সার্চ সম্পকে আরো বিস্তারিত জানুন ।  

সুত্র ঃ Techvilla24 

Leave a Reply

Your email address will not be published. Required fields are marked *