Text to Speech หรือ Speech synthesis เป็นเทคโนโลยีสังเคราะห์เสียงพูด โดยแปลงจากตัวอักษรให้กลายเป็นเสียงพูด โดย Text to Speech เป็นส่วนหนึ่งของสาขาการประมวลผลภาษาธรรมชาติ (Natural Language Processing) สำหรับ Text to Speech ภาษาไทย ปัจจุบันนี้ที่ยังมีให้บริการ API ตอนนี้มีเฉพาะของ Google Text to Speech
Google Translate มีเครื่องมือให้นักพัฒนานำความสามารถไปใช้กับโปรแกรมภายนอก ผ่านโมดูล googletrans เป็นโมดูลที่นำ Google Translate มาใช้งานร่วมกับ Python
ในบทความนี้จะขอแนะนำเทคนิคง่าย ๆ ที่อาจจะช่วยให้สามารถ scrape เว็บส่วนใหญ่ได้โดยไม่ติด error page นะครับ และก็จะสาธิตให้ดูโดยการ scrape เว็บต่าง ๆ ด้วยเทคนิคที่แนะนำไปนะครับ
บทความนี้ก็จะสอนวิธีหนึ่งที่สามารถทำได้ เพื่อหา XPath ที่ **"น่าจะ"** ครอบคลุมข้อมูลทั้งหมดที่เราต้องการมานะครับ ซึ่งเป็นวิธีที่ผู้เขียนเองก็ใช้งานอยู่จริงในการ scrape website ในหลาย ๆ ครั้ง
Code Inspector นี่มันเป็นแค่หนึ่งในหลาย ๆ tools ที่ Google Chrome มีให้ใน Google Chrome DevTools เท่านั้นนะครับ โดยจุดประสงค์หลัก ๆ ของ tools ทั้งหลายก็คือใช้เพื่อ debug เว็บที่เราเขียนขึ้นเอง โดยผู้ใช้สามารถเรียกดูได้ทั้งโครงสร้าง การทำงาน และ data ของเว็บที่รันอยู่แบบ real-time เลย ซึ่งล้วนแล้วแต่เป็น information ที่มีประโยชน์ต่อการ scrape ข้อมูลทั้งสิ้น
เพื่อเก็บข้อมูลที่มีอยู่ใน Internet มาทำการวิเคราะห์ เพราะสำหรับการวิเคราะห์ข้อมูล