สตาร์ทอัพ AI ที่ได้รับการสนับสนุนจาก Nvidia จะปล่อยอวาตาร์ที่แสดงอารมณ์ความรู้สึกของมนุษย์

ในฐานะนักลงทุนคริปโตที่มีพื้นฐานด้านเทคโนโลยีและปัญญาประดิษฐ์ ฉันรู้สึกตื่นเต้นกับการอัปเกรดอวตาร AI ล่าสุดของ Synthesia “อวตารที่แสดงออก” ของพวกเขามีศักยภาพที่จะปฏิวัติวิธีการสื่อสารของธุรกิจผ่านวิธีการดิจิทัล


บริษัท AI ชื่อ Synthesia ซึ่งได้รับการสนับสนุนจาก Nvidia เพิ่งเปิดตัวการปรับปรุงดังกล่าว การอัปเดตนี้ช่วยให้อวตารที่สร้างโดย AI แสดงอารมณ์และการกระทำของมนุษย์ได้อย่างแท้จริงยิ่งขึ้น

เมื่อวันที่ 25 เมษายน บริษัทได้เปิดตัว “อวตารที่ขับเคลื่อนด้วยข้อความทางอารมณ์” อวตารเหล่านี้ได้รับการออกแบบมาเพื่อถ่ายทอดอารมณ์เพื่อตอบสนองต่อคำสั่งที่เป็นข้อความ ทำให้เหมาะสำหรับใช้ในการนำเสนอขององค์กร สื่อการตลาด และเซสชันการฝึกอบรม

ในฐานะนักวิจัยที่กำลังศึกษาความก้าวหน้าล่าสุดในด้านปัญญาประดิษฐ์ ฉันตื่นเต้นที่จะแบ่งปันว่าเราบรรลุเป้าหมายสำคัญแล้ว นับเป็นครั้งแรกที่อวาตาร์ AI สามารถเข้าใจความหมายเบื้องหลังคำพูด

— Synthesia (@synthesiaIO) 25 เมษายน 2024

ความสามารถในการสร้างวิดีโอของ Sora ของ OpenAI มีชื่อเสียงในด้านการสร้างภาพเคลื่อนไหวที่เหมือนจริง

AI มีข้อจำกัด โดยเฉพาะอย่างยิ่งเมื่อต้องแสดงภาพมนุษย์ตามความเป็นจริง แทนที่จะแสดงคุณสมบัติและการเคลื่อนไหวอย่างแม่นยำ AI อาจแสดงส่วนต่างๆ ของร่างกายที่บิดเบี้ยว พื้นหลังที่ไม่เข้ากัน หรือริมฝีปากที่ไม่สอดคล้องกับคำพูด

ในการอัปเดตใหม่ล่าสุด Synthesia มุ่งเน้นไปที่การปรับปรุงการลิปซิงค์และความแม่นยำทางอารมณ์สำหรับบอท โดยใช้โปรแกรมอ่านสคริปต์ของมนุษย์ในกระบวนการผลิต

ในฐานะนักวิจัยที่ศึกษาปัญญาประดิษฐ์ขั้นสูง ฉันได้พบกับคำกล่าวที่น่าสนใจของ Victor Ribarbelli ซีอีโอและผู้ร่วมก่อตั้ง Synthesia ในวิดีโอล่าสุด เขาเน้นย้ำถึงช่องว่างสำคัญในการพัฒนาอวตาร แม้ว่ามนุษย์จะเข้าใจและตอบสนองต่ออารมณ์ที่ถ่ายทอดผ่านการแสดงออกทางสีหน้าโดยธรรมชาติ แต่อวตารยังขาดความสามารถนี้ พูดง่ายๆ จนกระทั่งตอนนี้ อวตารยังไม่เข้าใจความหมายที่อยู่เบื้องหลังคำพูดของเรา ซึ่งขัดขวางความฉลาดทางอารมณ์ของพวกเขา

ในบรรยากาศของสตูดิโอ บุคคลได้รับการสอนให้แสดงอารมณ์พื้นฐาน เช่น ความสุข ความเศร้า และความหงุดหงิดอย่างถูกต้อง ผ่านการแสดงออกทางสีหน้าและน้ำเสียงที่เหมาะสมเพื่อตอบสนองต่อสัญญาณง่ายๆ

ในฐานะนักลงทุน crypto ฉันตื่นเต้นที่จะแบ่งปันว่าการอัปเดตอวาตาร์ล่าสุดมาพร้อมกับชุดฟีเจอร์ที่น่าประทับใจ ขณะนี้สามารถเข้าถึงได้ในกว่า 130 ภาษา ทำให้ผู้ใช้ได้รับประสบการณ์ที่หลากหลายและครอบคลุมมากขึ้น นอกจากนี้ อวตารเหล่านี้ยังมีความสามารถในการสร้างคำบรรยายของตัวเอง เพื่อให้มั่นใจว่าผู้ใช้ทุกคนจะมีการสื่อสารที่ชัดเจน และหากยังไม่เพียงพอ พวกเขาสามารถเลียนแบบเสียงของผู้สร้างได้ โดยเพิ่มสัมผัสที่เป็นส่วนตัวให้กับแต่ละปฏิสัมพันธ์

ในบรรดาโมเดลอวาตาร์ที่สาธิตภาษาพูดอื่นที่ไม่ใช่ภาษาอังกฤษบนเว็บไซต์ของ Synthesia เช่น ฝรั่งเศส เยอรมัน และสเปน โมเดลภาษาอังกฤษแสดงให้เห็นถึงความซับซ้อนและความคล้ายคลึงกับคำพูดของมนุษย์ในระดับสูงสุด โดยอิงจากการประเมินที่ดำเนินการโดย CryptoMoon

ในฐานะนักวิจัย ฉันได้พบข้อมูลที่น่าสนใจเกี่ยวกับสตาร์ทอัพรายนี้ ตามรายงาน บริษัทอย่างน้อยครึ่งหนึ่งใน Fortune 100 ได้รับการกล่าวขานว่าเป็นลูกค้าของพวกเขา ซึ่งถือเป็นความสำเร็จที่น่าประทับใจทีเดียว นอกจากนี้ยังรองรับองค์กรมากกว่า 55,000 แห่ง ลูกค้าที่หลากหลายรายนี้ครอบคลุมอุตสาหกรรมต่างๆ และรวมถึงบริษัทที่มีชื่อเสียง เช่น Zoom, Xerox, Microsoft และ Reuters และอื่นๆ อีกมากมาย

Synthesia ก่อตั้งขึ้นในปี 2560 โดยเป็นบริษัทเทคโนโลยีในสหราชอาณาจักรซึ่งมีการเติบโตอย่างมาก ด้วยเทคโนโลยีปัญญาประดิษฐ์ (AI) ที่เพิ่มขึ้นอย่างรวดเร็วในปีที่ผ่านมา มูลค่าของบริษัทจึงเพิ่มสูงขึ้นเกือบ 1 พันล้านดอลลาร์ นักลงทุนที่มีชื่อเสียง รวมถึง Nvidia ซึ่งเป็นผู้เล่นชั้นนำในการผลิตชิปเซมิคอนดักเตอร์ AI ได้สนับสนุน Synthesia

ด้วยการมุ่งเน้นไปที่การสร้างอวตารที่เหมือนมนุษย์จริงสำหรับแอปพลิเคชันทางธุรกิจโดยเฉพาะ Synthesia สามารถหลีกเลี่ยงความฮือฮาและการแข่งขันที่รุนแรงที่แชทบอทโมเดลอื่นๆ ต้องเผชิญ เช่น ChatGPT ของ OpenAI และแชทบอท Gemini ของ Google ซึ่งใช้แนวทางที่กว้างขึ้น

Sorry. No data so far.

2024-04-26 15:12