Search Engine?

By | 29/05/2017
search engine

How search engine work?

Search engines ทำงานอย่างไรSearch engine มีหน้าที่หลักอยู่
2 ประการคือ การ crawl และสร้างindex , และการจัดหาผลลัพธ์โดยการหาความคำตอบที่เกี่ยวเนื่องและตรงตามความต้องการของผู้ใช้

จินตนการว่าโลกอินเตอร์เน็ตเหมือนกับโครงข่ายของสถานีรถไฟใต้ดินในเมืองใหญ่

แต่ละจุดพักจะมีเอกสารเฉพาะของตนเอง (โดยปกติเป็นหน้าเว็บเพจ แต่บางครั้งจะมีไฟล์ PDF, Jpg หรือไฟล์อื่นด้วย) โดยที่Search engine จะ crawl ไปทั่วทั้งเมืองและหาสถานีทั้งหมดตลอดเส้นทาง โดยตัว Search engine จะใช้สิ่งที่เรียกว่า “ลิงค์ (Link)” เป็นเส้นทางในการสืบค้น

ลิงค์ของโครงสร้างเว็บเป็นการรวมหน้าเพจทั้งหมดที่มีเข้าเป็นอันหนึ่งอันเดียวกัน

Search engine จะผ่านไปตามลิงค์ โดยใช้ Robot อัตโนมัติ ที่เรียกว่า Crawler หรือ Spiders ซึ่งสามารถเข้าถึงเอกสารที่มีการเชื่อมต่อกันหลายๆ พันล้านเอกสารได้

เมื่อตัว Search engine พบหน้าเว็บเพจแล้ว ตัว Search engine จะทำการถอดรหัสโค้ดจากหน้าเว็บเพจและทำการเก็บข้อมูลบางส่วนที่ถูกเลือกแล้วลงไปสู่ฮาร์ดดิสขนาดใหญ่ ซึ่งจะถูกเรียกใช้งานในภายหลังเมื่อถูกเรียกจากคำค้นหา (Search query) เพื่อที่จะบรรลุหน้าที่ในการเก็บเพจหลายร้อยล้านหน้า ซึ่งจะต้องถูกเข้าถึงในเสี้ยววินาทีนั้น ทำให้ Search engine จำเป็นต้องสร้างศูนย์ข้อมูล (datacenter) ทั่วโลก

ระบบเก็บข้อมูลอันใหญ่โตมโหฬารของ Search engine จะประกอบไปด้วยระบบประมวลผลหลายพันตัวเพื่อทำการประมวลผลข้อมูลจำนวนมหาศาล เมื่อมีคนทำการค้นหา พวกเขาต้องการที่จะได้คำตอบในทันที การล่าช้าเพียง 1 หรือ 2 วินาทีนั้น สามารถทำให้เกิดความไม่พอใจขึ้นได้ ดังนั้นตัว search engine จะต้องทำงานอย่างหนักเพื่อหาคำตอบให้เร็วที่สุดเท่าที่จะเร็วได้

เมื่อใครสักคนหาบางสิ่งบางอย่างในอินเตอร์เน็ต Search engine จะเป็นเครื่องมือในการหาเพื่อหาเอกสารหลายร้อยล้านชุด โดยที่ search engine จะทำสองสิ่งคือ หนึ่ง ส่งคำตอบที่มีความเกี่ยวข้องและเป็นประโยชน์สำหรับคำค้นหาของคนหาข้อมูล และ สอง คือการเรียงลำดับคำตอบตามความสำคัญของข้อมูล ทั้ง “ความเกี่ยวข้อง” และ “ความสำคัญ” ซึ่งสิ่งเหล่านี้จะมีผลต่อขบวนการทำ SEO

ในการค้นหาของ engine นั้น จะให้ความสำคัญกับความเกี่ยวข้องมากกว่าการหาคำที่เหมือนในหน้าเพจแบบง่ายๆ โดยในยุคเริ่มต้นของ search engine นั้น search engine ไม่มีความสามารถมากมาย โดยมีการใช้ขั้นตอนง่ายในการค้นหาซึ่งส่งผลทำให้ได้ผลลัพธ์ที่ไม่ดี แต่ทาง search engine ได้มีการพัฒนาอย่างต่อเนื่องจึงทำให้ engine สามารถหาคำตอบคำตอบได้ดีกว่าเดิม ซึ่งจะทำให้ผู้ค้นหาพึงพอใจมากขึ้น วันนี้ทาง search engine ได้มีปัจจัยของความเกี่ยวข้องเป็น 100 ปัจจัยที่ใช้ในการทำงาน และหลายๆ ปัจจัยจะถูกพูดถึงในบทความนี้

Search Engine วัดความสำคัญอย่างไร?

ในปัจจุบัน engine หลักของโลกจะแปลความของคำว่าความสำคัญเหมือนกับความนิยม นั้นหมายความว่า เว็บไซด์, เพจ หรือ เอกสารใดๆ ยิ่งได้รับความนิยมมากเท่าไร ข้อมูลที่อยู่ภายในนั้นก็ยิ่งจะมีค่าความสำคัญมากขึ้นเท่านั้น สมมุติฐานข้อมูลนี้ได้ถูกพิสูจน์ว่าใช้งานได้ดีในทางปฏิบัติ โดยทาง engine มีการเพิ่มของพอใจของผู้ใช้อย่างต่อเนื่องโดยการใช้ชุดปัจจัยจำนวนมากมาเป็นตัววัดความนิยม

ความนิยมและความเกี่ยวข้องไม่สามารถวัดได้โดยตรง แต่ engine จะใช้ด้วยสมการทางคณิตศาสตร์ ที่เรียกว่า อัลกอริทึม เพื่อที่จะแยกแยะสิ่งที่มีคุณค่าและสำคัญ รวมถึงใช้ในการจัดอันดับของผลลัพธ์อีกด้วย

อัลกอริทึมนั้นจะประกอบด้วยหลายร้อยส่วนประกอบ ในด้านการตลาดการค้นหา เราจะเรียกส่วนประกอบเหล่านั้นว่า “ปัจจัยการจัดอันดับ (Ranking factors)