วันพุธที่ 29 สิงหาคม พ.ศ. 2555

Google ใช้วิธีการแปลภาษา โดยวิธี ยูเนียน หรอ...


Google Translate ทำงานอย่างไร?

[เอ.อาร์.ไอ.พี, www.arip.co.th] Google Translate เครื่องมือแปลภาษาที่เปิดให้ใช้ฟรี โดยสามารถแปลได้ตั้งแต่ข้อความที่เป็นประโยคไปจนถึงเอกสารทั้งหน้า หรือแม้แต่ทั้งเว็บไซต์ อย่างไรก็ตาม เชื่อว่า คุณผู้อ่านของ arip หลายคนคงอยากทราบว่า Google Translate มีการทำงานอย่างไร? ทำไมมันถึงได้เข้าใจภาษาต่างๆ และสามารถแปลออกมาได้ค่อนข้างถูกต้องในบางภาษา?




สำหรับการแปลภาษาของ Google Translate จะมาจากการประมวลผลของคอมพิวเตอร์หลายเครื่องด้วยกัน โดยคอมพิวเตอร์เหล่านี้จะใช้กระบวนการแปลที่เรียกว่า "statistical machine translation" หรือ "ระบบการแปลภาษาเชิงสถิติ" ซึ่งเป็นวิธีที่คอมพิวเตอร์ใช้แปลความหมายของประโยค โดยอ้างอิงจากรูปแบบของข้อความจำนวนมาก เพื่อให้ข้อความที่แปลมีความใกล้เคียงกับภาษามนุษย์


ลองนึกย้อนไปในสมัยเรียนภาษาอื่นๆ หากคุณต้องการสอนใครสักคนให้สามารถพูดภาษาใหม่ได้ คุณอาจจะเริ่มต้นด้วยการสอนคำศัพท์ และกฎไวยกรณ์ที่จะบอกว่า โครงสร้างประโยคของภาษาเป็นอย่างไร? คอมพิวเตอร์สามาถเรียนรู้ภาษาต่างๆ ของมนุษย์ได้ด้วยวิธีเดียวกัน นั่นก็คือ การอ้างอิงจากความหมายของคำศัพท์ และกฎไวยกรณ์ แต่ในความเป็นจริง ภาษาต่างๆ จะมีความซับซ้อน ซึ่งครูสอนภาษาหลายคนก็มักจะบอกตรงกันว่า มันมีข้อยกเว้นสำหรับการใช้กฎต่างๆ ด้วย เมื่อคุณพยายามใช้ข้อยกเว้นเหล่านั้นทั้งหมด ก็จะพบว่า มันมีข้อยกเว้นของข้อยกเว้นขึ้นมาอีก จึงไม่น่าแปลกใจว่า คุณภาพของโปรแกรมแปลภาษาด้วยคอมพิวเตอร์จึงไม่เป็นที่น่าพอใจเท่าที่ควร แต่สำหรับ Google Translate จะใช้วิธีแปลที่แตกต่างจากโปรแกรมทั่วไป


แทนที่ Google Translate จะใช้วิธีสอนให้คอมพิวเตอร์รู้จักกฎไวยกรณ์ของภาษา ทีมพัฒนาใช้วิธีทำให้คอมพิวเตอร์สามารถค้นพบรูปแบบ หรือกฎการแปลภาษาด้วยตัวมันเอง ซึ่งคอมพิวเตอร์ทั้งระบบสามารถทำสิ่งนี้ได้โดยวิเคราะห์จากเอกสารหลายล้านชุดที่มีการแปลออกมาแล้วโดยมนุษย์ ซึ่งข้อความที่แปลแล้วมาจากหนังสือต่างๆ จากองค์กรอย่าง UN และเว็บไซต์จากทั่วโลก โดยคอมพิวเตอร์สามารถสแกนข้อความต่างๆ เพื่อค้นหาสถิติที่สามารถให้ข้อสรุปที่ชัดเจนของรูปแบบการแปลเทียบกับการแปลคำต่อคำจนสามารถตัดสินใจได้ว่า ประโยคนั้นๆ ควรจะแปลว่าอย่างไรกันแน่ เมื่อคอมพิวเตอร์พบรูปแบบของการแปลที่ชัดเจน (สถิติการแปลยืนยันว่า ส่วนใหญ่ต้องแปลแบบนี้) ระบบก็จะใช้รูปแบบนั้นแปลข้อความที่คล้ายกันออกมาได้ เมื่อคอมพิวเตอร์ผ่านกระบวนการแปลซ้ำๆ ไปเรื่อยๆ ด้วยรูปแบบต่างๆ โปรแกรมก็จะมีความฉลาดในการแปลเพิ่มขึ้นตามไปด้วย

อย่างไรก็ตาม เนื่องจากบางภาษามีเอกสารให้โปรแกรมได้เรียนรู้ค่อนข้างน้อย นั่นเป็นสาเหตุให้คุณภาพการแปลภาษาของ Google Translate มีความแตกต่างกันไป ซึ่ง Google ยอมรับว่า ระบบการแปลยังไม่สมบูรณ์ แต่ด้วยการที่ระบบได้รับข้อความแปลใหม่ๆ ตลอดเวลา มันจะทำให้คอมพิวเตอร์ฉลาดขึ้น และการแปลก็จะดีขึ้นเรื่อยๆ ตามไปด้วย ดังนั้นทุกครั้งที่คุณแปลประโยค หรือเว็บเพจด้วย Google Translate พึงระลึกว่า การแปลที่เห็นนั้นเกิดจากการประมวลผลเอกสารการแปลหลายล้านชุด และหลายพันล้านรูปแบบการแปล ซึ่งหลายต่อหลายครั้งผู้ใช้จะทึ่งกับผลลัพธ์การแปลที่ได้



เอามาจากนี้นะ : http://googlesystem.blogspot.com






1 ความคิดเห็น:

  1. You maу luck into the рeгfect ωеdding dress in
    a garage salе! It's that special time in a woman's life - what iѕ my wedding dгess going to loоk like on theіr own wedding сeгemony, specifically for women.
    Or, you can finԁ some of the moѕt sought after
    environmentally conscious desіgners, Deboгah Lindquіѕt createѕ exquisite apparel out of a" white-dress-only" mindset anԁ into
    some intеresting alteгnativeѕ. Мany modеls ωіth different tiѕsue ωill be eхposed to your sight but
    the problem is whiсh one you hаve tо retuгn for fittingѕ?


    Feel free to visit my page; ao cuoi [cuming4u.com]

    ตอบลบ