สารบัญ:

15 สิ่งมหัศจรรย์ที่โครงข่ายประสาทเรียนรู้ที่จะทำ
15 สิ่งมหัศจรรย์ที่โครงข่ายประสาทเรียนรู้ที่จะทำ
Anonim

ตั้งแต่การขับรถไปจนถึงการสร้างสรรค์ผลงานชิ้นเอก

15 สิ่งมหัศจรรย์ที่โครงข่ายประสาทเรียนรู้ที่จะทำ
15 สิ่งมหัศจรรย์ที่โครงข่ายประสาทเรียนรู้ที่จะทำ

โครงข่ายประสาทเทียมเป็นปัญญาประดิษฐ์ที่สามารถเรียนรู้ด้วยตนเองได้ ในบางรูปแบบ มีโปรแกรมที่คล้ายคลึงกันคือเทคโนโลยีประสาทคอมพิวเตอร์: ทฤษฎีและการปฏิบัติในทศวรรษที่ 80 แต่พื้นที่นี้ได้รับการพัฒนาอย่างรวดเร็วโดยเฉพาะในช่วงปี 2015 มหาวิทยาลัยชั้นนำอย่างแมสซาชูเซตส์และอ็อกซ์ฟอร์ด รวมถึงองค์กรขนาดใหญ่ เช่น Google เริ่มสำรวจความเป็นไปได้ของโครงข่ายประสาทเทียมอย่างจริงจัง

ตอนนี้เทคโนโลยีเหล่านี้มีให้สำหรับทุกคน และมนุษยชาติก็มีแอพพลิเคชั่นที่บ้าและแปลกประหลาดที่สุดสำหรับโปรแกรมดังกล่าวแล้ว นี่คือบางส่วนของพวกเขา

1. มากับใบหน้าของคนที่ไม่มีตัวตน

โครงข่ายประสาทเทียมสามารถประดิษฐ์ใบหน้าของคนที่ไม่มีตัวตนได้
โครงข่ายประสาทเทียมสามารถประดิษฐ์ใบหน้าของคนที่ไม่มีตัวตนได้

คนที่คุณเห็นในภาพด้านบนดูสมจริง แต่ไม่มีอยู่จริง รูปภาพของพวกเขาสร้าง GAN ที่ก้าวหน้าขึ้นเพื่อการปรับปรุง

คุณภาพ ความเสถียร และโครงข่ายประสาทที่แปรผันจาก NVIDIA โปรแกรมนี้ได้รับการฝึกฝนเกี่ยวกับภาพถ่ายจริงของคนดัง และด้วยเหตุนี้ โปรแกรมจึงได้เรียนรู้วิธีสร้างภาพใบหน้าที่น่าเชื่อถือ คุณสามารถตรวจสอบด้วยตัวเองว่าเธอทำได้ดีเพียงใด

2. อ่านออกเสียง

มีเทคโนโลยีมากมายสำหรับการสังเคราะห์คำพูดโดยใช้โครงข่ายประสาทเทียม เพื่อจุดประสงค์นี้ มีโปรแกรมสำหรับสิ่งนี้ ตัวอย่างเช่น และ "" คำพูดที่สร้างขึ้นในลักษณะนี้มีความลื่นไหลและสมจริง และมีประโยชน์มากมายสำหรับวิธีนี้ ตั้งแต่แอปพลิเคชันการทำสำเนาสำหรับผู้พิการทางสายตา ไปจนถึงการสร้างหนังสือเสียงด้วยต้นทุนที่ต่ำ

3. ขับรถ

หลายบริษัทมองว่ารถยนต์ไร้คนขับเป็นอนาคตของการคมนาคมขนส่ง Audi, Uber, Google, Tesla, Yandex และบริษัทอื่นๆ อีกมากมีพัฒนาการของตนเองในด้านนี้ แทบไม่มีเทคโนโลยีใดที่สมบูรณ์แบบหากไม่มีโครงข่ายประสาทเทียม ช่วยให้รถระบุตำแหน่งที่มีเครื่องหมาย ป้าย ยานพาหนะอื่นๆ และคนเดินถนนอยู่บนถนน และตัดสินใจโดยอิงจากข้อมูลนี้

4. กู้คืนสีของภาพถ่ายและวิดีโอ

นักวิทยาศาสตร์จากมหาวิทยาลัยวาเซดะในโตเกียวได้พัฒนาให้มีสี! โปรแกรมที่ทำให้ภาพถ่ายและวิดีโอขาวดำเป็นสี โครงข่ายประสาทเทียมได้เรียนรู้ที่จะระบุแรงจูงใจทั่วไปในภาพ (ท้องฟ้ามักจะเป็นสีฟ้า ต้นไม้เป็นสีเขียว และอื่นๆ) และการวาดภาพวัตถุด้วยสีที่เหมาะสม

5. เห็นหน้าสุนัขทุกที่

เทคโนโลยีโครงข่ายประสาทเทียมเทคโนโลยีแรกที่พร้อมให้บริการแก่ผู้ชมในวงกว้างคือ Inceptionism Inceptionism ของ Google ในปี 2015 เธอประมวลผลภาพโดยเพิ่มเงาของใบหน้าสุนัข เจดีย์ และส่วนโค้งให้กับภาพเหล่านั้น ชาวเน็ตเริ่มส่งภาพถ่าย ภาพวาด วิดีโอ และภาพยนตร์ที่มีชื่อเสียงผ่านรายการ ซึ่งกลายเป็นเรื่องแปลกและน่าขนลุก

6. เขียนเพลง

ข้อมูลดิจิทัลทุกประเภทสามารถโหลดลงในโครงข่ายประสาทเทียม ซึ่งรวมถึงเพลงด้วย นักวิจัยบางคนฝึกโปรแกรมของพวกเขาเกี่ยวกับเพลงของนักประพันธ์เพลงที่มีชื่อเสียง คอมพิวเตอร์ยังไม่ได้สร้างองค์ประกอบที่มีความหมาย แต่สามารถเลียนแบบสไตล์ของนักดนตรีได้ค่อนข้างดี

7. ทำให้นักการเมืองพูดอะไรก็ได้

การใช้โครงข่ายประสาทเทียมที่น่ากลัวที่สุดอย่างหนึ่งคือการสังเคราะห์วิดีโอ โดยเฉพาะกับบุคคลสาธารณะ ตัวอย่างเช่น นักวิทยาศาสตร์ที่มหาวิทยาลัยวอชิงตันได้พัฒนา Synthesizing Obama: Learning Lip Sync from Audio ซึ่งเป็นโปรแกรมที่สร้างการเคลื่อนไหวของริมฝีปากของ Barack Obama จากการบันทึกเสียงและแทนที่ในวิดีโอ ปรากฎว่าน่าเชื่อถือมาก

8. เดิน

DeepMind บริษัท ย่อยของ Google ได้ทำการทดสอบ หุ่นจำลอง 3 ตัวที่แตกต่างกัน - มนุษย์ ไม้ที่มีสองขา และลูกบอลสี่ขา - ต้องเรียนรู้ที่จะเดิน พวกเขาไม่มีข้อมูลเกี่ยวกับวิธีการทำสิ่งนี้ - มีเพียงงานที่ได้รับจากจุดหนึ่งไปยังอีกจุดหนึ่งและเซ็นเซอร์ที่ช่วยกำหนดตำแหน่งของพวกเขาในอวกาศ หลังจากฝึกฝนหลายร้อยชั่วโมง หุ่นทั้งสามเรียนรู้ที่จะเดิน วิ่ง กระโดด และเคลื่อนไหวบนพื้นผิวที่ไม่เรียบ

9. หุ่นยนต์ควบคุม

เทคโนโลยีที่ใช้โครงข่ายประสาทเทียมถูกนำมาใช้กันอย่างแพร่หลายในวิทยาการหุ่นยนต์ตัวอย่างเช่น หุ่นยนต์ที่สร้างขึ้นโดยสถาบันวิจัยดิสนีย์สามารถก้าวไปข้างหน้าด้วยขาหนึ่ง สอง และสาม และหุ่นยนต์ส่งของจาก Starship Technologies จะนำทางไปตามถนน หลีกเลี่ยงสิ่งกีดขวางและคนเดินถนน

10. ตระหนักถึงการฉ้อโกงและการทุจริต

หน้าที่หลักอย่างหนึ่งของโครงข่ายประสาทเทียมคือการรู้จำรูปแบบ ซึ่งรวมถึงความสัมพันธ์ระหว่างเหตุการณ์ต่างๆ สิ่งนี้มีประโยชน์มากในด้านการเงิน: คุณสามารถทำนายกิจกรรมที่ผิดกฎหมายได้ก่อนที่จะเกิดขึ้น ตัวอย่างเช่น ในสเปน นักวิทยาศาสตร์ได้สร้าง Predicting Public Corruption ด้วย Neural Networks: An Analysis of Spanish Provinces ซึ่งเป็นโปรแกรมที่ช่วยตรวจหาการทุจริตในจังหวัดต่างๆ ของประเทศ และธนาคารบางแห่งกำลังพัฒนา Citi Ventures Deploys Machine Learning และ Artificial Intelligence With People และกำลังใช้ระบบที่จดจำการฉ้อโกงบัตรเครดิต

11. แปลข้อความบนภาพแบบเรียลไทม์

โครงข่ายประสาทเทียมสามารถแปลข้อความบนภาพได้แบบเรียลไทม์
โครงข่ายประสาทเทียมสามารถแปลข้อความบนภาพได้แบบเรียลไทม์

คุณลักษณะการแปลข้อความแบบเรียลไทม์ปรากฏใน Google แปลภาษามาเป็นเวลานาน แต่มีเพียงไม่กี่คนที่รู้ว่าคุณลักษณะนี้ใช้วิธีที่ Google แปลภาษาบีบอัดการเรียนรู้เชิงลึกบนเครือข่ายประสาทของโทรศัพท์ ด้วยความช่วยเหลือของพวกเขา โปรแกรมจะจดจำตัวอักษรและสัญลักษณ์อื่นๆ ในภาพ แม้ว่าจะเบลอ หมุนไปรอบๆ แกน มีสไตล์หรือบิดเบี้ยวก็ตาม จากนั้นแอปพลิเคชันจะใส่คำและประโยค แปลและฉายภาพลงบนภาพ และทั้งหมดนี้ในเสี้ยววินาที

12. ถ่ายโอนรูปแบบศิลปะจากภาพหนึ่งไปอีกภาพหนึ่ง

โครงข่ายประสาทเทียมสามารถถ่ายทอดรูปแบบศิลปะจากภาพหนึ่งไปยังอีกภาพหนึ่งได้
โครงข่ายประสาทเทียมสามารถถ่ายทอดรูปแบบศิลปะจากภาพหนึ่งไปยังอีกภาพหนึ่งได้

ในปี 2559 หลายบริษัทได้นำเสนอเทคโนโลยีสำหรับการประมวลผลภาพในรูปแบบศิลปะที่แตกต่างกัน มีแอพอย่าง Prisma, DeepArt และ Ostagram ปรากฏขึ้น Prisma ให้คุณเลือกฟิลเตอร์ที่สร้างไว้ล่วงหน้าได้หลายร้อยฟิลเตอร์ และ Ostagram และ DeepArt - คุณสามารถอัปโหลดรูปภาพหรือภาพถ่ายด้วยตัวเอง ซึ่งจะเป็นแหล่งของสไตล์

13. เปลี่ยนภาพสเก็ตช์หยาบๆ ให้กลายเป็นภาพวาดเสมือนจริง

ในช่วงต้นปี 2019 NVIDIA ได้แสดง Stroke of Genius: GauGAN เปลี่ยน Doodles ให้สวยงาม ซึ่งเป็นโปรแกรม Photorealistic Landscapes ที่จะเปลี่ยนรูปภาพจากรูปทรงง่ายๆ ไม่กี่แบบให้เป็นรูปภาพที่มีรายละเอียดสวยงาม ผู้ใช้ทำสองสามจังหวะและโครงข่ายประสาทเทียมสร้างภาพจากสิ่งนี้ซึ่งไม่สามารถแยกแยะได้จากผืนผ้าใบที่แท้จริงของจิตรกรภูมิทัศน์บางคน ทะเล, หิน, เมือง, ป่า, เมฆ - สามารถเพิ่มวัตถุต่าง ๆ มากมายให้กับรูปภาพ โครงข่ายประสาทเองก็กำหนดตำแหน่งที่ต้องการเงาหรือแสงสะท้อน

14. อ่านริมฝีปาก

นักวิทยาศาสตร์จาก Google และ Oxford University ได้สร้างเทคโนโลยี LipNet LipNet ซึ่งใช้โครงข่ายประสาทเทียมในการอ่านริมฝีปาก และเธอทำมันได้แม่นยำกว่าคนมาก โดยเฉลี่ยแล้ว ผู้ที่มีความบกพร่องทางการได้ยินอ่านริมฝีปากด้วยความแม่นยำ 52% และ LipNet แม่นยำ 88%

15. เขียนข้อความ

ผู้คนสอนโครงข่ายประสาทเทียมและวิธีการทำงานกับข้อความ โปรแกรมต่างๆ เขียนโดย Deep-speare: A Joint Neural Model of Poetic Language, Meter and Rhymeกวีนิพนธ์, เรื่องสั้น, ข้อความปลอมสำหรับ Wikipedia, สคริปต์สำหรับสิ่งพิมพ์ (เช่น สำหรับ Friends)

และในปี 2559 ภาพยนตร์สั้นเรื่องแรกของโลก Sunspring ได้เปิดตัว ซึ่งเป็นบทที่เขียนขึ้นโดยปัญญาประดิษฐ์ ภาพยนตร์ไม่มีความหมายอย่างยิ่ง: คอมพิวเตอร์ยังคงดิ้นรนเพื่อสร้าง แต่ใครจะไปรู้ บางทีหลังจากนั้นไม่กี่ปี อาชีพนักเขียนบทก็จะลดลงเหลือแค่งานตัดต่อที่เครื่องสร้างขึ้นเอง