15 สิ่งมหัศจรรย์ที่โครงข่ายประสาทเรียนรู้ที่จะทำ

สารบัญ:

1. มากับใบหน้าของคนที่ไม่มีตัวตน
2. อ่านออกเสียง
3. ขับรถ
4. กู้คืนสีของภาพถ่ายและวิดีโอ
5. เห็นหน้าสุนัขทุกที่
6. เขียนเพลง
7. ทำให้นักการเมืองพูดอะไรก็ได้
8. เดิน
9. หุ่นยนต์ควบคุม
10. ตระหนักถึงการฉ้อโกงและการทุจริต
11. แปลข้อความบนภาพแบบเรียลไทม์
12. ถ่ายโอนรูปแบบศิลปะจากภาพหนึ่งไปอีกภาพหนึ่ง
13. เปลี่ยนภาพสเก็ตช์หยาบๆ ให้กลายเป็นภาพวาดเสมือนจริง
14. อ่านริมฝีปาก
15. เขียนข้อความ

15 สิ่งมหัศจรรย์ที่โครงข่ายประสาทเรียนรู้ที่จะทำ

2024 ผู้เขียน: Malcolm Clapton | [email protected]. แก้ไขล่าสุด: 2023-12-17 04:12

ตั้งแต่การขับรถไปจนถึงการสร้างสรรค์ผลงานชิ้นเอก

โครงข่ายประสาทเทียมเป็นปัญญาประดิษฐ์ที่สามารถเรียนรู้ด้วยตนเองได้ ในบางรูปแบบ มีโปรแกรมที่คล้ายคลึงกันคือเทคโนโลยีประสาทคอมพิวเตอร์: ทฤษฎีและการปฏิบัติในทศวรรษที่ 80 แต่พื้นที่นี้ได้รับการพัฒนาอย่างรวดเร็วโดยเฉพาะในช่วงปี 2015 มหาวิทยาลัยชั้นนำอย่างแมสซาชูเซตส์และอ็อกซ์ฟอร์ด รวมถึงองค์กรขนาดใหญ่ เช่น Google เริ่มสำรวจความเป็นไปได้ของโครงข่ายประสาทเทียมอย่างจริงจัง

ตอนนี้เทคโนโลยีเหล่านี้มีให้สำหรับทุกคน และมนุษยชาติก็มีแอพพลิเคชั่นที่บ้าและแปลกประหลาดที่สุดสำหรับโปรแกรมดังกล่าวแล้ว นี่คือบางส่วนของพวกเขา

1. มากับใบหน้าของคนที่ไม่มีตัวตน

โครงข่ายประสาทเทียมสามารถประดิษฐ์ใบหน้าของคนที่ไม่มีตัวตนได้

คนที่คุณเห็นในภาพด้านบนดูสมจริง แต่ไม่มีอยู่จริง รูปภาพของพวกเขาสร้าง GAN ที่ก้าวหน้าขึ้นเพื่อการปรับปรุง

คุณภาพ ความเสถียร และโครงข่ายประสาทที่แปรผันจาก NVIDIA โปรแกรมนี้ได้รับการฝึกฝนเกี่ยวกับภาพถ่ายจริงของคนดัง และด้วยเหตุนี้ โปรแกรมจึงได้เรียนรู้วิธีสร้างภาพใบหน้าที่น่าเชื่อถือ คุณสามารถตรวจสอบด้วยตัวเองว่าเธอทำได้ดีเพียงใด

2. อ่านออกเสียง

มีเทคโนโลยีมากมายสำหรับการสังเคราะห์คำพูดโดยใช้โครงข่ายประสาทเทียม เพื่อจุดประสงค์นี้ มีโปรแกรมสำหรับสิ่งนี้ ตัวอย่างเช่น และ "" คำพูดที่สร้างขึ้นในลักษณะนี้มีความลื่นไหลและสมจริง และมีประโยชน์มากมายสำหรับวิธีนี้ ตั้งแต่แอปพลิเคชันการทำสำเนาสำหรับผู้พิการทางสายตา ไปจนถึงการสร้างหนังสือเสียงด้วยต้นทุนที่ต่ำ

3. ขับรถ

หลายบริษัทมองว่ารถยนต์ไร้คนขับเป็นอนาคตของการคมนาคมขนส่ง Audi, Uber, Google, Tesla, Yandex และบริษัทอื่นๆ อีกมากมีพัฒนาการของตนเองในด้านนี้ แทบไม่มีเทคโนโลยีใดที่สมบูรณ์แบบหากไม่มีโครงข่ายประสาทเทียม ช่วยให้รถระบุตำแหน่งที่มีเครื่องหมาย ป้าย ยานพาหนะอื่นๆ และคนเดินถนนอยู่บนถนน และตัดสินใจโดยอิงจากข้อมูลนี้

4. กู้คืนสีของภาพถ่ายและวิดีโอ

นักวิทยาศาสตร์จากมหาวิทยาลัยวาเซดะในโตเกียวได้พัฒนาให้มีสี! โปรแกรมที่ทำให้ภาพถ่ายและวิดีโอขาวดำเป็นสี โครงข่ายประสาทเทียมได้เรียนรู้ที่จะระบุแรงจูงใจทั่วไปในภาพ (ท้องฟ้ามักจะเป็นสีฟ้า ต้นไม้เป็นสีเขียว และอื่นๆ) และการวาดภาพวัตถุด้วยสีที่เหมาะสม

5. เห็นหน้าสุนัขทุกที่

เทคโนโลยีโครงข่ายประสาทเทียมเทคโนโลยีแรกที่พร้อมให้บริการแก่ผู้ชมในวงกว้างคือ Inceptionism Inceptionism ของ Google ในปี 2015 เธอประมวลผลภาพโดยเพิ่มเงาของใบหน้าสุนัข เจดีย์ และส่วนโค้งให้กับภาพเหล่านั้น ชาวเน็ตเริ่มส่งภาพถ่าย ภาพวาด วิดีโอ และภาพยนตร์ที่มีชื่อเสียงผ่านรายการ ซึ่งกลายเป็นเรื่องแปลกและน่าขนลุก

6. เขียนเพลง

ข้อมูลดิจิทัลทุกประเภทสามารถโหลดลงในโครงข่ายประสาทเทียม ซึ่งรวมถึงเพลงด้วย นักวิจัยบางคนฝึกโปรแกรมของพวกเขาเกี่ยวกับเพลงของนักประพันธ์เพลงที่มีชื่อเสียง คอมพิวเตอร์ยังไม่ได้สร้างองค์ประกอบที่มีความหมาย แต่สามารถเลียนแบบสไตล์ของนักดนตรีได้ค่อนข้างดี

7. ทำให้นักการเมืองพูดอะไรก็ได้

การใช้โครงข่ายประสาทเทียมที่น่ากลัวที่สุดอย่างหนึ่งคือการสังเคราะห์วิดีโอ โดยเฉพาะกับบุคคลสาธารณะ ตัวอย่างเช่น นักวิทยาศาสตร์ที่มหาวิทยาลัยวอชิงตันได้พัฒนา Synthesizing Obama: Learning Lip Sync from Audio ซึ่งเป็นโปรแกรมที่สร้างการเคลื่อนไหวของริมฝีปากของ Barack Obama จากการบันทึกเสียงและแทนที่ในวิดีโอ ปรากฎว่าน่าเชื่อถือมาก

8. เดิน

DeepMind บริษัท ย่อยของ Google ได้ทำการทดสอบ หุ่นจำลอง 3 ตัวที่แตกต่างกัน - มนุษย์ ไม้ที่มีสองขา และลูกบอลสี่ขา - ต้องเรียนรู้ที่จะเดิน พวกเขาไม่มีข้อมูลเกี่ยวกับวิธีการทำสิ่งนี้ - มีเพียงงานที่ได้รับจากจุดหนึ่งไปยังอีกจุดหนึ่งและเซ็นเซอร์ที่ช่วยกำหนดตำแหน่งของพวกเขาในอวกาศ หลังจากฝึกฝนหลายร้อยชั่วโมง หุ่นทั้งสามเรียนรู้ที่จะเดิน วิ่ง กระโดด และเคลื่อนไหวบนพื้นผิวที่ไม่เรียบ

9. หุ่นยนต์ควบคุม

เทคโนโลยีที่ใช้โครงข่ายประสาทเทียมถูกนำมาใช้กันอย่างแพร่หลายในวิทยาการหุ่นยนต์ตัวอย่างเช่น หุ่นยนต์ที่สร้างขึ้นโดยสถาบันวิจัยดิสนีย์สามารถก้าวไปข้างหน้าด้วยขาหนึ่ง สอง และสาม และหุ่นยนต์ส่งของจาก Starship Technologies จะนำทางไปตามถนน หลีกเลี่ยงสิ่งกีดขวางและคนเดินถนน

10. ตระหนักถึงการฉ้อโกงและการทุจริต

หน้าที่หลักอย่างหนึ่งของโครงข่ายประสาทเทียมคือการรู้จำรูปแบบ ซึ่งรวมถึงความสัมพันธ์ระหว่างเหตุการณ์ต่างๆ สิ่งนี้มีประโยชน์มากในด้านการเงิน: คุณสามารถทำนายกิจกรรมที่ผิดกฎหมายได้ก่อนที่จะเกิดขึ้น ตัวอย่างเช่น ในสเปน นักวิทยาศาสตร์ได้สร้าง Predicting Public Corruption ด้วย Neural Networks: An Analysis of Spanish Provinces ซึ่งเป็นโปรแกรมที่ช่วยตรวจหาการทุจริตในจังหวัดต่างๆ ของประเทศ และธนาคารบางแห่งกำลังพัฒนา Citi Ventures Deploys Machine Learning และ Artificial Intelligence With People และกำลังใช้ระบบที่จดจำการฉ้อโกงบัตรเครดิต

11. แปลข้อความบนภาพแบบเรียลไทม์

โครงข่ายประสาทเทียมสามารถแปลข้อความบนภาพได้แบบเรียลไทม์

คุณลักษณะการแปลข้อความแบบเรียลไทม์ปรากฏใน Google แปลภาษามาเป็นเวลานาน แต่มีเพียงไม่กี่คนที่รู้ว่าคุณลักษณะนี้ใช้วิธีที่ Google แปลภาษาบีบอัดการเรียนรู้เชิงลึกบนเครือข่ายประสาทของโทรศัพท์ ด้วยความช่วยเหลือของพวกเขา โปรแกรมจะจดจำตัวอักษรและสัญลักษณ์อื่นๆ ในภาพ แม้ว่าจะเบลอ หมุนไปรอบๆ แกน มีสไตล์หรือบิดเบี้ยวก็ตาม จากนั้นแอปพลิเคชันจะใส่คำและประโยค แปลและฉายภาพลงบนภาพ และทั้งหมดนี้ในเสี้ยววินาที

12. ถ่ายโอนรูปแบบศิลปะจากภาพหนึ่งไปอีกภาพหนึ่ง

โครงข่ายประสาทเทียมสามารถถ่ายทอดรูปแบบศิลปะจากภาพหนึ่งไปยังอีกภาพหนึ่งได้

ในปี 2559 หลายบริษัทได้นำเสนอเทคโนโลยีสำหรับการประมวลผลภาพในรูปแบบศิลปะที่แตกต่างกัน มีแอพอย่าง Prisma, DeepArt และ Ostagram ปรากฏขึ้น Prisma ให้คุณเลือกฟิลเตอร์ที่สร้างไว้ล่วงหน้าได้หลายร้อยฟิลเตอร์ และ Ostagram และ DeepArt - คุณสามารถอัปโหลดรูปภาพหรือภาพถ่ายด้วยตัวเอง ซึ่งจะเป็นแหล่งของสไตล์

13. เปลี่ยนภาพสเก็ตช์หยาบๆ ให้กลายเป็นภาพวาดเสมือนจริง

ในช่วงต้นปี 2019 NVIDIA ได้แสดง Stroke of Genius: GauGAN เปลี่ยน Doodles ให้สวยงาม ซึ่งเป็นโปรแกรม Photorealistic Landscapes ที่จะเปลี่ยนรูปภาพจากรูปทรงง่ายๆ ไม่กี่แบบให้เป็นรูปภาพที่มีรายละเอียดสวยงาม ผู้ใช้ทำสองสามจังหวะและโครงข่ายประสาทเทียมสร้างภาพจากสิ่งนี้ซึ่งไม่สามารถแยกแยะได้จากผืนผ้าใบที่แท้จริงของจิตรกรภูมิทัศน์บางคน ทะเล, หิน, เมือง, ป่า, เมฆ - สามารถเพิ่มวัตถุต่าง ๆ มากมายให้กับรูปภาพ โครงข่ายประสาทเองก็กำหนดตำแหน่งที่ต้องการเงาหรือแสงสะท้อน

14. อ่านริมฝีปาก

นักวิทยาศาสตร์จาก Google และ Oxford University ได้สร้างเทคโนโลยี LipNet LipNet ซึ่งใช้โครงข่ายประสาทเทียมในการอ่านริมฝีปาก และเธอทำมันได้แม่นยำกว่าคนมาก โดยเฉลี่ยแล้ว ผู้ที่มีความบกพร่องทางการได้ยินอ่านริมฝีปากด้วยความแม่นยำ 52% และ LipNet แม่นยำ 88%

15. เขียนข้อความ

ผู้คนสอนโครงข่ายประสาทเทียมและวิธีการทำงานกับข้อความ โปรแกรมต่างๆ เขียนโดย Deep-speare: A Joint Neural Model of Poetic Language, Meter and Rhymeกวีนิพนธ์, เรื่องสั้น, ข้อความปลอมสำหรับ Wikipedia, สคริปต์สำหรับสิ่งพิมพ์ (เช่น สำหรับ Friends)

และในปี 2559 ภาพยนตร์สั้นเรื่องแรกของโลก Sunspring ได้เปิดตัว ซึ่งเป็นบทที่เขียนขึ้นโดยปัญญาประดิษฐ์ ภาพยนตร์ไม่มีความหมายอย่างยิ่ง: คอมพิวเตอร์ยังคงดิ้นรนเพื่อสร้าง แต่ใครจะไปรู้ บางทีหลังจากนั้นไม่กี่ปี อาชีพนักเขียนบทก็จะลดลงเหลือแค่งานตัดต่อที่เครื่องสร้างขึ้นเอง

15 สิ่งมหัศจรรย์ที่โครงข่ายประสาทเรียนรู้ที่จะทำ

สารบัญ:

1. มากับใบหน้าของคนที่ไม่มีตัวตน

2. อ่านออกเสียง

3. ขับรถ

4. กู้คืนสีของภาพถ่ายและวิดีโอ

5. เห็นหน้าสุนัขทุกที่

6. เขียนเพลง

7. ทำให้นักการเมืองพูดอะไรก็ได้

8. เดิน

9. หุ่นยนต์ควบคุม

10. ตระหนักถึงการฉ้อโกงและการทุจริต

11. แปลข้อความบนภาพแบบเรียลไทม์

12. ถ่ายโอนรูปแบบศิลปะจากภาพหนึ่งไปอีกภาพหนึ่ง

13. เปลี่ยนภาพสเก็ตช์หยาบๆ ให้กลายเป็นภาพวาดเสมือนจริง

14. อ่านริมฝีปาก

15. เขียนข้อความ

Split vs fullbody: สิ่งที่ควรเลือกสำหรับผู้เริ่มต้นและนักกีฬาขั้นสูง

Supersets คืออะไรและจะช่วยให้คุณสร้างกล้ามเนื้อเร็วขึ้นหรือไม่?

ต้องยืนบาร์ขนาดไหน

จากนกฮูกเป็นนก: การออกกำลังกายตอนเช้าเปลี่ยนชีวิตอย่างไร

30 ท่าออกกำลังกายน้ำหนักตัวที่จะทำให้คุณฟิต

5 วงกลมนรก: ออกกำลังกายที่บ้านเพื่อหุ่นสวย

จะเกิดอะไรขึ้นกับร่างกาย เมื่อคุณหยุดออกกำลังกาย

4 กีฬาที่ช่วยยืดอายุขัย

ทดสอบความแข็งแกร่งของคุณใน 4 นาที

การออกกำลังกายประจำวัน: 5 แบบฝึกหัดเพื่อสร้างขาของคุณและลดน้ำหนัก

3 ท่าออกกำลังกายสำหรับมือใหม่หัดเล่น

การออกกำลังกายประจำวัน: 3 Supersets ง่ายๆ สำหรับแขนและไหล่ที่สมบูรณ์แบบ

ทำไมคุณต้องกระโดดเชือกและทำอย่างไรให้ถูกต้อง

Leo Babauta กับแรงจูงใจในการทำงานและการไม่ทำงานเพื่อเรียนรู้

ทำไม Dark Beginnings เป็นแฟนตาซีที่มีแนวโน้มมากที่สุดแห่งปี

ผิดหวัง ซีซั่น 2: วันที่วางจำหน่าย, ตัวอย่าง, พล็อต