อัลกอริธึมการเรียนรู้ของเครื่อง 10 อันดับแรก: เหตุใดจึงมีความสำคัญในปี 2564
เผยแพร่แล้ว: 2019-06-10สารบัญ
ลงหลุมกระต่ายของแมชชีนเลิร์นนิง
แอปพลิเคชั่นในชีวิตจริง
อัลกอริธึมการเรียนรู้ของเครื่องหมายถึงอะไร
ประเภทของการเรียนรู้ของเครื่อง
อัลกอริทึมการเรียนรู้ของเครื่อง 10 อันดับแรก
สรุป
ในปี 2564 คอมพิวเตอร์ไม่เพียงแต่ มองเห็น แต่สามารถ อ่าน และ เขียน เองได้ด้วย
มาดูเรื่องราวสยองขวัญสมัยใหม่ที่เราอาศัยอยู่กัน
ตัวอย่างเช่น คุณจะตอบสนองอย่างไรถ้ามีคนบอกคุณว่าอีก 30% ของงานจะถูกแทนที่ด้วยระบบอัตโนมัติ มันอุกอาจใช่มั้ย?
แล้วมันเกี่ยวอะไรกับ อัลกอริธึมการเรียนรู้ของเครื่อง ?
โชคดีที่มีแสงสว่างที่ปลายอุโมงค์ ให้ฉันแนะนำคุณผ่านมัน
ในปี 2021 คอมพิวเตอร์สามารถ:
- จดจำเสียง ใบหน้า และลายมือ (สไตล์ซีเอสไอ…)
- คำบรรยายภาพโดยอัตโนมัติ
- เรียนรู้วิธีจดจำเนื้อหาของรูปภาพและจำแนกตามคุณสมบัติเฉพาะ
- ทำงานให้คุณ (และสร้างอัลกอริธึมที่จำเป็นเพื่อดึงออกมา)
รายการดำเนินต่อไปแน่นอน
ทุกวันเราทำการค้นหาเว็บ เยี่ยมชมเว็บไซต์และโซเชียลมีเดีย และเราไม่เคยถามตัวเองด้วยคำถามพื้นฐาน:
เทคโนโลยี AI ไปไกลแค่ไหน?
ไปเลย!
ความสำเร็จของเทคโนโลยีทำให้เกิดคำถามเกี่ยวกับอนาคตของมนุษยชาติ
บางทีข้อเท็จจริงเหล่านี้อาจให้ข้อมูลเชิงลึกแก่เรา:
(ที่มา: อนาคต , ดีไซร์ )
- ในเกาหลีใต้ออกจากทุก 100 คน, 4.78 ค่าเฉลี่ยเป็นหุ่นยนต์
- 88% ของพนักงานในเอธิโอเปียมีความเสี่ยงที่จะตกงานให้กับหุ่นยนต์
- ในนิวยอร์กซิตี้, พนักงานที่ใกล้สูญพันธุ์เป็น 40.7%
- ต้องใช้โค้ด 9 บรรทัด ในการเขียนโปรแกรมแมชชีนเลิร์นนิง
- 97% ของงานทำอาหารจานด่วนจะถูกแทนที่ด้วยเครื่องจักร
- เกษตรกร 98% จะตกงานให้กับเครื่องจักร
- แมชชีนเลิร์นนิงสามารถสร้างรายได้สูงถึง 1 พันล้านดอลลาร์ ต่อปีในอุตสาหกรรมยา
- ใน 10 ปีข้างหน้าการเรียนรู้เครื่องคาดว่าจะเข้ามาแทนที่ 25% ของงาน
ในปี 2564 เราสามารถเป็นเจ้าของหุ่นยนต์ได้ที่บ้าน
คุณสามารถมีการสนทนาได้อย่างคล่องแคล่วด้วย Jibo หรือ Tapia พวกมันถูกเรียกว่า หุ่นยนต์โซเชียล ด้วยเหตุผล
พวกเขาจำชื่อ ใบหน้า และเสียงของเพื่อนและสมาชิกในครอบครัวของคุณ (ซึ่งไม่น่ากลัวเลย!) พวกเขาสามารถดูแลลูกของคุณได้ (ใช่แล้ว!) และหากคุณประสบอุบัติเหตุที่บ้าน พวกเขาจะโทรหา 911 เพื่อ คุณ. อันสุดท้ายนั้นมีประโยชน์อย่างยิ่งเมื่อไม่มีใครอยู่ใกล้ๆ แต่เราจะพูดถึงเรื่องนี้ในภายหลัง
ทุกวันนี้ อัลกอริธึมสามารถ "สอนตัวเอง" ภาษา และแม้แต่แปลที่พูดภาษาอังกฤษเป็นภาษาจีนเขียนพร้อมกันด้วยความคล่องแคล่วของผู้พูดภาษาจีนโดยเฉลี่ย ไม่ช้าก็เร็วการเรียนภาษาต่างประเทศจะล้าสมัยอย่างหลีกเลี่ยงไม่ได้
แล้วเรื่องนี้ล่ะ:
สมาร์ทโฟนของเรากำลังสอดแนมเราอย่างแท้จริง… ฉันแน่ใจว่าคุณรู้แน่ชัดว่าฉันกำลังพูดถึงอะไร! ลองนึกภาพ - ที่รับประทานอาหารกลางวันที่สำนักงานคุณพูดถึงคุณต้องการที่จะเริ่มต้นดูลูซิเฟอร์ (วาจา) กลับมาที่โต๊ะทำงานของคุณ คุณเปิด Pinterest หรือ Facebook บนโทรศัพท์ของคุณ และนั่นคือเขา – ปีศาจเอง… (ใช่ ทอม เอลลิสเป็นคนช่างฝัน แต่นั่นไม่ใช่ประเด็น!)
ระบบคำแนะนำอยู่รอบตัวเรา หากคุณป้อนการค้นหา "Lego" รูปภาพที่เกี่ยวข้องซึ่งปรากฏขึ้นและจัดอยู่ในประเภท Lego ได้รับการยอมรับโดย AI กล่าวอีกนัยหนึ่ง พวกเขาไม่ได้ใส่คำอธิบายประกอบด้วยตนเองเป็นบล็อกเลโก้ โดยมนุษย์...
อัลกอริธึมได้สอนตัวเอง ว่าสิ่ง นี้คือ อะไร โดยดูจากภาพหลายล้านภาพ
ขนลุก!
ความสามารถทั้งหมดเหล่านั้นและอื่น ๆ อีกมากมาย ถูกนำไปใช้โดยบริษัทต่างๆ แล้ว
ความหมายที่นี่คือ:
ครั้งแรกที่คอมพิวเตอร์แล้วมีอำนาจที่จะสร้างอัลกอริทึมของ AI สอนตัวเอง เถอะพวก! คิดถึงคนงานหุ่นยนต์ทั้งหมดในอนาคต พวกเขาจะเรียนรู้และปฏิบัติงานได้เร็วกว่าคนงานที่เป็นมนุษย์
และอย่าง ที่สอง – ฉันรู้ว่าคุณกำลังคิดอะไรอยู่ – OMG มนุษยชาติถึงวาระแล้ว!
หลายคนมีปฏิกิริยาเช่นนี้
ผู้เขียนหลายคนในช่วงศตวรรษที่ผ่านมาได้เขียนเกี่ยวกับอนาคตที่หุ่นยนต์ครอบงำมนุษย์ ปัญญาประดิษฐ์กำลังเฟื่องฟู หุ่นยนต์จะครองโลกและกินมนุษย์ ภาวะเอกฐานอยู่ใกล้
ตกลง นี้เป็นสถานที่ที่ดีที่จะหยุด
ตอนนี้เราได้สิ่งนั้นออกจากระบบแล้ว มาดูกันว่าอะไรจริงตามข้อเท็จจริง
ลงหลุมกระต่ายของแมชชีนเลิร์นนิง
เราต้องการบริบทก่อน
15,000 ปีที่แล้วมีการประดิษฐ์เกมที่เป็นที่รักมากที่สุดในโลกเกมหนึ่ง ที่ไหนสักแห่งระหว่างวันที่ 12 และศตวรรษที่ 14 เกมที่กลายเป็นที่รู้จักหมากรุก
มี 10 ยกกำลัง 40 ผลลัพธ์ที่เป็นไปได้ (นั่นคือ 1 โดยมีศูนย์ 40 ตัวในตอนท้าย)
ในปี 2560 อัลกอริธึม AlphaZero ของ Google ใช้ แมชชีนเลิร์นนิง เพื่อสอนตัวเองให้เล่นและชนะเกม
กระบวนการทั้งหมด ตั้งแต่การแนะนำเกมไปจนถึงอัลกอริธึม จนกระทั่งมันชนะเกมแรกกับ Stockfish ซึ่งเป็นหนึ่งในเครื่องมือหมากรุกที่แข็งแกร่งที่สุดในโลก
(รั้งตัวเอง!)
4 ชั่วโมง.
อุ๊ย!
ใช่ เราใกล้จะถึง การปฏิวัติการเรียนรู้ ของ เครื่อง แล้ว
เมื่อมองย้อนกลับไป นี่ไม่ใช่การหยุดชะงักครั้งแรกของประเภทนี้ การปฏิวัติอุตสาหกรรมในช่วงปลายศตวรรษที่ 19 และต้นศตวรรษที่ 20 ได้ก่อให้เกิดการหยุดชะงักทางสังคมเช่นกัน แต่ในที่สุด มนุษยชาติและเครื่องจักรก็บรรลุความสมดุล
ใช่ สิ่งต่าง ๆ กำลังเปลี่ยนแปลง และนั่นก็เป็นสิ่งที่ดีจริงๆ!
ซอฟต์แวร์แมชชีนเลิร์นนิงมีพลังในการมองปัญหาด้วยสายตาที่สดใสและนำทางผ่านสภาพแวดล้อมที่ไม่รู้จัก
อย่างที่เรากำลังจะได้เห็น มันไม่ใช่เรื่องราวสยองขวัญอีกต่อไป
เหมือนปาฏิหาริย์ทางเทคโนโลยี
ตอนนี้:
ทำไมการจำแนกประเภทจึงมีความสำคัญ?
สำหรับผู้เริ่มต้น แมชชีนเลิร์นนิง ตาม คำจำกัดความ คืออะไร
โดยพื้นฐานแล้ว เครื่องได้รับการตั้งโปรแกรมให้สอนตัวเองถึงวิธีสร้างโปรแกรมและสร้างโซลูชัน แมชชีนเลิร์นนิงจะสร้างตัวเลขที่แม่นยำที่สุดเสมอ (และหากจำเป็น – การคาดคะเน) ที่เป็นไปได้
ลองนึกถึงเทคโนโลยีที่สามารถแก้ปัญหาต่างๆ ได้หลากหลายโดยสิ้นเชิง
และนั่นคือความงามของมัน!
วัตถุประสงค์หลักของระบบคือการจำแนก นี้จะเรียกว่าวิสัยทัศน์คอมพิวเตอร์ มันจะเรียนรู้ด้วยตัวเองเพื่อสร้างความแตกต่าง และจำนวนปัญหาต่างๆ ในโลกที่สามารถลดเหลือเป็นงานการจำแนกที่ดูเหมือนง่าย ๆ ได้นั้นเป็นเรื่องที่น่าคิดมาก
ลองนึกภาพความสามารถในการจำแนกระหว่าง:
- ตำแหน่งหมากรุกที่ดีและไม่ดี (เกม)
- ประโยคที่ถูกต้องและไม่ถูกต้องตามหลักไวยากรณ์ (แปล)
- ถนนที่ว่างเปล่าและถนนที่มีรถยนต์หรือคนเดินเท้า (รถยนต์ที่ขับเอง)
- เซลล์ที่แข็งแรงและเซลล์มะเร็ง (การวินิจฉัยทางการแพทย์)
นั่นเป็นสาเหตุว่าทำไมผู้เชี่ยวชาญในหลาย ๆ ด้านจึงล้าสมัย คุณไม่จำเป็นต้องเป็นผู้เชี่ยวชาญในการสร้างโค้ดที่จะทำงานดังกล่าว พวกที่เขียนโปรแกรมแปลภาษาอังกฤษเป็นจีนพร้อมกันไม่ได้พูดภาษาจีนเลย
อัลกอริทึมจะสอนตัวเองถึงวิธีการเป็นผู้เชี่ยวชาญ
และใช่ สิ่งสำคัญคือต้องเรียนรู้เกี่ยวกับสิ่งเหล่านี้และทำความรู้จักกับพวกเขา… วิธีที่เราได้รู้จักคอมพิวเตอร์ในตอนแรก
เราเก่งเรื่องคอมพิวเตอร์แล้ว ดีมากที่เรามักจะทำให้เป็นมนุษย์ (หรืออาจจะเป็นแค่ฉัน?)
ดูเหมือนว่านี่เป็นเวลาที่จะถามตัวเองว่า
จะเกิดอะไรขึ้นกับคนเหล่านั้นที่จะตกงานในโปรแกรม AI และแมชชีนเลิร์นนิงในที่สุด?
คุณเคยได้ยินเรื่องเล็กๆ น้อยๆ ที่เรียกว่า Universal Basic Income หรือไม่?
นี่มันไป:
ในอนาคตประชาชนจะมีรายได้ที่ไม่เกี่ยวข้องกับการทำงานใดๆ เงินจะมาจากประสิทธิภาพที่บ้าคลั่งที่ระบบอัตโนมัติจะให้และการประหยัดที่มาจากมัน
ไม่ว่าจะเป็นสิ่งนี้หรือ - สถานการณ์ที่สมจริงกว่าเล็กน้อย - งานประเภทใหม่มากมายจะปรากฏขึ้น ในช่วงปลายศตวรรษที่ 19 ประมาณ 50% ของประชากรในสหรัฐอเมริกาเกี่ยวข้องกับการเกษตร ตอนนี้ต้องขอบคุณเครื่องจักรอันทรงพลังที่ทำให้มีเกษตรกรน้อยกว่า 2% แต่ยังมีคนจ้างงานอยู่
แล้ว แมชชีนเลิร์นนิงใช้ทำ อะไรได้บ้าง ?
แอปพลิเคชั่นในชีวิตจริง
สามารถใช้แมชชีนเลิร์นนิงเพื่ออนุมานข้อเท็จจริงใหม่จากฐานข้อมูลได้
ลองมาดูบางส่วนของพื้นที่ที่มีการเรียนรู้เครื่องจะสร้างความแตกต่างที่ดี:
- ระบบช่วยขับขี่ – รถยนต์สามารถเหยียบเบรกให้คุณโดยอัตโนมัติ เมื่อคุณเข้าใกล้รถคันข้างหน้า และด้วยเหตุนี้ ณ จุดใดจุดหนึ่งในอนาคต มนุษยชาติเกือบจะลืมว่า อุบัติเหตุทางรถยนต์ หมายถึงอะไร รถยนต์ไร้คนขับกำลังเดินทาง
- การดูแลสุขภาพ – เพิ่มประสิทธิภาพของบุคลากรทางการแพทย์ การรับรู้และการวินิจฉัยโรคจะง่ายขึ้นและแม่นยำยิ่งขึ้นด้วยความช่วยเหลือของการเรียนรู้ของเครื่อง ตัวอย่างเช่น โปรแกรมไม่เพียงแต่สแกนและระบุภาพเนื้อเยื่อมะเร็งได้ดีกว่ามนุษย์เท่านั้น แต่ยังสามารถคำนวณอัตราการรอดชีวิตของผู้ป่วยตามฐานข้อมูลขนาดใหญ่ของเวชระเบียน (ตรวจสอบผลงานของ Jeremy Howard และโครงการของเขาที่ชื่อว่า Enlitic น่าทึ่งมาก!)
- การประดิษฐ์ยา – ด้วยความช่วยเหลือของการเรียนรู้ด้วยเครื่อง ผู้ป่วยแต่ละรายสามารถรับการรักษาที่ออกแบบมาโดยเฉพาะสำหรับเขา
- เกษตรกรรม – การทำฟาร์มจะเป็นไปโดยอัตโนมัติด้วยคอมพิวเตอร์วิทัศน์และการควบคุมด้วยหุ่นยนต์: คุณภาพและการทำนายผล การตรวจหาโรค สวัสดิภาพปศุสัตว์ และการผลิต
- ความสามารถในการใช้ภาษา AI ขับเคลื่อน - ในอนาคตอันใกล้เราจะสามารถที่จะสื่อสารด้วยวาจากับการแปลแบบ real-time โดยใช้ AI
แมชชีนเลิร์นนิงเป็นเพียงเครื่องมือ และจะยังคงเป็นเครื่องมือหนึ่งในอนาคตอันใกล้
ดังนั้นไม่ต้องกังวล เอนหลังและผ่อนคลาย
ตอนนี้เราได้เห็นแล้วว่าแมชชีนเลิร์นนิงคืออะไร เรามาถามคำถามต่อไปกัน:
อัลกอริธึมการเรียนรู้ของเครื่องหมายถึงอะไร
ดังนั้น หลังจากที่เรากำหนดว่าแมชชีนเลิร์นนิงมีความสำคัญและเป็นประโยชน์ต่อการเรียนรู้ของเครื่องในอนาคตมากเพียงใด มาดูอัลกอริธึมที่ทำให้เวทมนตร์เกิดขึ้นอย่างละเอียดยิ่งขึ้น
วิธีที่ยอดเยี่ยมในการอธิบายอัลกอริธึมการเรียนรู้ของเครื่องคือการ เปรียบเทียบ กับการเขียนโปรแกรมแบบดั้งเดิม
ใน การเขียนโปรแกรมแบบดั้งเดิม โปรแกรมเมอร์ ทำงานในทีมที่มีผู้เชี่ยวชาญในสาขานั้นๆ ซึ่งซอฟต์แวร์กำลังอยู่ระหว่างการพัฒนา ยิ่งงานซับซ้อน - รหัสยิ่งยาวและเขียนยากขึ้นเท่านั้น
อัลกอริธึมการเรียนรู้ของเครื่อง ทำงานค่อนข้างแตกต่าง อัลกอริธึมรับชุดข้อมูลสำหรับอินพุต – และชุดข้อมูล เสริม สำหรับเอาต์พุต จากนั้นวิเคราะห์ (หรือพวกเขา) และ ดำเนินการตามกระบวนการที่ต้องเกิดขึ้นเพื่อให้ได้ผลลัพธ์ที่เป็นประโยชน์ วันนี้เป็นงานที่สงวนไว้สำหรับโปรแกรมเมอร์ที่เป็นมนุษย์ ในอนาคตก็จะเปลี่ยนไปเช่นกัน
ประเภทของการเรียนรู้ของเครื่อง
อัลกอริธึม การเรียนรู้ของเครื่อง มี 4 ประเภท
นี่คือ:
1. การเรียนรู้ภายใต้การดูแล
ข้อมูลอินพุตในอัลกอริธึมการเรียนรู้ภายใต้การดูแลจะมีป้ายกำกับ และเอาต์พุตเป็นที่รู้จักและถูกต้อง ในการใช้อัลกอริธึมคลาสนี้ คุณจะต้องมีข้อมูลที่มีป้ายกำกับจำนวนมาก และนั่นอาจไม่ใช่เรื่องง่ายเสมอไป
ขั้นตอนวิธีการภายใต้การดูแลตกอยู่ในสองประเภท - การถดถอยและการจำแนก แต่ละคนตรวจสอบชุดข้อมูลที่แตกต่างกัน
อัลกอริธึมการถดถอยคือสิ่งที่คาดการณ์และคาดการณ์ ข้อมูลเหล่านี้รวมถึงการพยากรณ์อากาศ การเติบโตของประชากร การคาดคะเนอายุขัย การคาดการณ์ของตลาด
อัลกอริธึมการจำแนกประเภทใช้สำหรับการวินิจฉัย การตรวจจับการปลอมแปลงข้อมูลประจำตัว การรักษาลูกค้า และการจัดประเภทรูปภาพตามชื่อที่แนะนำ
2. การเรียนรู้แบบไม่มีผู้ดูแล
เกิดขึ้นเมื่อข้อมูลอินพุตไม่มีป้ายกำกับ พวกเขาจัดระเบียบข้อมูลเป็นโครงสร้างของคลัสเตอร์ ดังนั้นข้อมูลที่ป้อนเข้าจึงพร้อมสำหรับการวิเคราะห์ทันที
เนื่องจากไม่มีการระบุข้อมูล จึงไม่มีทางประเมินความถูกต้องของผลลัพธ์ได้ ที่กล่าวว่าไม่ใช่ความถูกต้องที่อัลกอริธึมที่ไม่มีการควบคุมได้รับการออกแบบมาเพื่อติดตาม คลัสเตอร์ที่อัลกอริทึมสร้างขึ้นนั้นไม่คุ้นเคยกับโปรแกรม แนวคิดคือการป้อนข้อมูล วิเคราะห์ และจัดกลุ่มเป็นกลุ่ม
เช่นเดียวกับขั้นตอนวิธีการภายใต้การดูแลญาติใกล้ชิดของพวกเขาจะถูกแบ่งออกเป็น 2 ประเภท - การลดมิติและการจัดกลุ่ม
อัลกอริธึมการทำคลัสเตอร์เองเป็นส่วนหนึ่งของสิ่งนี้อย่างชัดเจน การจัดกลุ่มข้อมูลเป็นหมวดหมู่มีประโยชน์ ดังนั้นคุณจึงไม่ต้องจัดการทีละส่วน อัลกอริธึมเหล่านี้ใช้เหนือสิ่งอื่นใดสำหรับการแบ่งส่วนลูกค้าและการตลาดแบบกำหนดเป้าหมาย
อัลกอริธึมการลดมิติใช้สำหรับการค้นพบโครงสร้าง การสร้างภาพข้อมูลขนาดใหญ่ การแสดงคุณลักษณะ และการบีบอัดที่มีความหมาย หากการรวมกลุ่มเป็นด้านหนึ่งของเหรียญ การลดมิติจะเป็นอีกด้านหนึ่ง โดยการจัดกลุ่มข้อมูลออกเป็นคลัสเตอร์ อัลกอริธึมจะลดจำนวนตัวแปรที่มีความหมาย (มิติ) ที่อธิบายชุดข้อมูลอย่างหลีกเลี่ยงไม่ได้
ขณะนี้ มีคลาสของอัลกอริธึมการเรียนรู้ของเครื่องที่รวม 2 คลาสก่อนหน้านี้:
3. การเรียนรู้กึ่งควบคุม
มันยืนอยู่ภายใต้การดูแลระหว่างที่มีข้อมูลที่มีข้อความและขั้นตอนวิธีการใกล้ชิดกับข้อมูลที่ไม่มีป้ายกำกับ
อัลกอริธึมกึ่งควบคุมจะใช้ข้อมูลที่มีป้ายกำกับจำนวนเล็กน้อยและข้อมูลที่ไม่มีป้ายกำกับจำนวนมาก สิ่งนี้สามารถนำไปสู่การปรับปรุงความแม่นยำในการเรียนรู้
นอกจากนี้ยังเป็นการบรรเทาอย่างมากในแง่ของการรวบรวมข้อมูลเนื่องจากต้องใช้ทรัพยากรจำนวนมากเพื่อสร้างข้อมูลที่มีป้ายกำกับ
4. การเรียนรู้การเสริมแรง
อัลกอริธึมการเสริมแรงจะเลือกการดำเนินการตามชุดข้อมูลไม่เหมือนกับ 3 ประเภทก่อนหน้า จากนั้นพวกเขาจะประเมินผลลัพธ์และเปลี่ยนกลยุทธ์หากจำเป็น
ในอัลกอริธึมการเสริมแรง คุณสร้างเครือข่ายและวงจรของการกระทำ เท่านี้ก็เรียบร้อย โดยไม่ต้องสร้างฐานข้อมูล คุณมีผู้ชนะ ทำไม?
มันเป็นอัลกอริธึมการเสริมกำลังที่คิดหาเกมหมากฮอส หมากรุก และโก
งานเรียนรู้การเสริมแรงบนหลักการลองผิดลองถูก ระบบจะได้รับรางวัลบางอย่างที่จะช่วยวัดอัตราความสำเร็จ ในกรณีของเกม – รางวัลจะเป็นกระดานคะแนน เมื่อใดก็ตามที่ระบบได้คะแนน ระบบจะประเมินว่าเป็นการย้ายที่ประสบความสำเร็จและสถานะของการย้ายนี้จะสูงขึ้น มันจะวนซ้ำไปเรื่อยๆ จนกว่าการเคลื่อนไหวทั้งหมดจะสำเร็จ
และนั่นคือวิธีที่เรามีอัลกอริธึมที่สามารถควบคุมเกมหมากรุกได้ภายใน 4 ชั่วโมง
ตอนนี้เรารู้แล้ว!
ไม่เป็นอะไร. มาดูอัลกอริธึมกัน:
อัลกอริทึมการเรียนรู้ของเครื่อง 10 อันดับแรก
ก่อนที่เราจะเริ่มต้น มาดูหนึ่งในแนวคิดหลักในการเรียนรู้ของเครื่องกันก่อน ถดถอยเมื่อมันมาถึงขั้นตอนวิธีการเรียนรู้เครื่องถดถอยหมายความว่าอัลกอริทึมจะพยายามที่จะสร้างความสัมพันธ์ระหว่างสองตัวแปร
การถดถอยมีหลายประเภท – การถดถอยเชิงเส้น โลจิสติก พหุนาม การถดถอยกำลังสองน้อยที่สุดสามัญ และอื่นๆ วันนี้เราจะมาพูดถึง 2 ประเภทแรกกัน เพราะไม่เช่นนั้นจะตีพิมพ์เป็นหนังสือได้ดีกว่าบทความ
อย่างที่เราจะได้เห็นกันในอีกสักครู่ อัลกอริธึม 10 อันดับแรกส่วนใหญ่เป็นอัลกอริธึมการเรียนรู้ภายใต้การดูแลและใช้กับ Python ได้ดีที่สุด
รายชื่ออัลกอริธึมการเรียนรู้ของเครื่อง 10 อันดับแรก มา ดังนี้:
1. การถดถอยเชิงเส้น
เป็นหนึ่งในอัลกอริธึมการเรียนรู้ของเครื่องที่ได้รับความนิยมมากที่สุด มันทำงานเพื่อสร้างความสัมพันธ์ระหว่างสองตัวแปรโดยปรับสมการเชิงเส้นให้เหมาะสมผ่านข้อมูลที่สังเกตได้

กล่าวอีกนัยหนึ่ง อัลกอริธึมประเภทนี้จะสังเกตคุณลักษณะต่างๆ เพื่อที่จะได้ข้อสรุป หากจำนวนตัวแปรมากกว่า 2 ตัว อัลกอริทึมจะเรียกว่าการถดถอยเชิงเส้นพหุคูณ
การถดถอยเชิงเส้นยังเป็นหนึ่งในขั้นตอนวิธีการเรียนรู้ของเครื่องภายใต้การดูแลการทำงานที่ดีในหลาม เป็นเครื่องมือทางสถิติที่มีประสิทธิภาพและสามารถนำไปใช้ในการทำนายพฤติกรรมผู้บริโภค ประมาณการการพยากรณ์ และการประเมินแนวโน้ม บริษัทจะได้รับประโยชน์จากการวิเคราะห์เชิงเส้นและคาดการณ์ยอดขายในช่วงระยะเวลาหนึ่งในอนาคต
ดังนั้นถ้าเรามีสองตัวแปรหนึ่งในนั้นคือการอธิบายและอื่น ๆ ที่เป็นขึ้นอยู่กับ ตัวแปรตามแสดงถึงค่าที่คุณต้องการค้นคว้าหรือคาดการณ์ ตัวแปรอธิบายเป็นอิสระ ตัวแปรตามจะนับตามคำอธิบายเสมอ
จุดประสงค์ของการเรียนรู้ของเครื่องเชิงเส้นตรงคือการดูว่าตัวแปรทั้งสองมีความสัมพันธ์กันอย่างมีนัยสำคัญหรือไม่ และถ้ามี เพื่อดูว่าตัวแปรนั้นแสดงถึงอะไร
การถดถอยเชิงเส้นถือเป็นอัลกอริธึมการเรียนรู้ของเครื่องอย่างง่าย ดังนั้นจึงเป็นที่นิยมในหมู่นักวิทยาศาสตร์
ตอนนี้ มีการถดถอยเชิงเส้น และมีการถดถอยโลจิสติก มาดูความแตกต่างกัน:
2. การถดถอยโลจิสติก
นี้เป็นหนึ่งในขั้นตอนวิธีการเรียนรู้ของเครื่องขั้นพื้นฐาน มันเป็นลักษณนามทวินามที่มีเพียง 2 รัฐหรือ 2 ค่า - ข้อมูลที่ป้อนเข้าจะถูกบีบอัดและวิเคราะห์แล้ว
อัลกอริธึมลอจิสติกต่างจากการถดถอยเชิงเส้นตรงจากการทำนายโดยใช้ฟังก์ชันไม่เชิงเส้น อัลกอริทึมการถดถอยโลจิสติกใช้สำหรับการจัดประเภทไม่ใช่สำหรับงานถดถอย "การถดถอย" ในชื่อแนะนำว่าอัลกอริธึมใช้โมเดลเชิงเส้นและรวมเข้ากับพื้นที่ในอนาคต
การถดถอยโลจิสติกเป็น อัลกอริธึมแมชชีนเลิร์นนิงที่ มีการ ควบคุมดูแล ซึ่งก็เหมือนกับการถดถอยเชิงเส้น ซึ่งทำงานได้ดีใน Python จากมุมมองทางคณิตศาสตร์ หากข้อมูลที่ส่งออกของการวิจัยคาดว่าจะเป็นผู้ป่วย/สุขภาพ หรือมะเร็ง/ไม่มีมะเร็ง การถดถอยโลจิสติกเป็นอัลกอริธึมที่สมบูรณ์แบบ
ซึ่งแตกต่างจากการถดถอยเชิงเส้นที่ข้อมูลเอาต์พุตอาจมีค่าต่างกัน การถดถอยโลจิสติกสามารถมีเอาต์พุตได้เพียง 1 และ 0 เท่านั้น
การถดถอยโลจิสติกมี 3 ประเภท ขึ้นอยู่กับการตอบสนองอย่างเด็ดขาด เหล่านี้คือ:
- การถดถอยโลจิสติกแบบไบนารี – นี่เป็นประเภทที่ใช้บ่อยที่สุดหากผลลัพธ์เป็น "ใช่"/"ไม่ใช่" ที่หลากหลาย
- การถดถอยโลจิสติกแบบพหุ นาม – เมื่อมีความเป็นไปได้ 3 คำตอบขึ้นไปโดยไม่มีการเรียงลำดับ
- การถดถอยโลจิสติกลำดับ – อีกครั้ง 3 หรือมากกว่าคำตอบ แต่มีการสั่งซื้อ ตัวอย่างเช่น เมื่อผลลัพธ์ที่คาดหวังอยู่ในระดับ 1 ถึง 10
มาดูอัลกอริธึมการจำแนกที่ยอดเยี่ยมอื่น:
3. การวิเคราะห์การเลือกปฏิบัติเชิงเส้น
วิธีนี้จะค้นหาการผสมผสานของคุณสมบัติเชิงเส้น ซึ่งแยกข้อมูลอินพุตที่ต่างกันออกไป จุดประสงค์ของอัลกอริธึม LDA คือการตรวจสอบตัวแปรที่เชื่อถือได้ว่าเป็นการรวมเชิงเส้นของคุณลักษณะ มันเป็นเทคนิคการจัดหมวดหมู่ที่ดี
อัลกอริธึมนี้จะตรวจสอบคุณภาพทางสถิติของข้อมูลที่ป้อนเข้า และทำการคำนวณสำหรับแต่ละคลาส มันวัดค่าของคลาสแล้วค่าความแปรปรวนระหว่างคลาสทั้งหมด
ในระหว่างกระบวนการสร้างแบบจำลองความแตกต่างระหว่างคลาส อัลกอริธึมจะตรวจสอบข้อมูลอินพุตตามตัวแปรอิสระ
ข้อมูลที่ส่งออกมีข้อมูลเกี่ยวกับคลาสที่มีค่าสูงสุด การทำงานจำแนกเชิงเส้นการวิเคราะห์ขั้นตอนวิธีการที่ดีที่สุดสำหรับการแยกประเภทที่รู้จักกันในหมู่ เมื่อปัจจัยหลายอย่างจำเป็นต้องแบ่งตามหมวดหมู่ทางคณิตศาสตร์ เราใช้อัลกอริทึม LDA
4. K- เพื่อนบ้านที่ ใกล้ที่สุด
อัลกอริทึม kNN เป็นหนึ่งในขั้นตอนวิธีการเรียนรู้ของเครื่องที่ดีสำหรับผู้เริ่มต้น พวกเขาคาดการณ์ตามข้อมูลที่มีอยู่เดิม เพื่อ จัดประเภทข้อมูลเป็นหมวดหมู่ ตามลักษณะที่แตกต่างกัน
อยู่ใน รายการอัลกอริธึมการเรียนรู้ของเครื่องภายใต้ การ ดูแล ซึ่งส่วนใหญ่ใช้สำหรับการจัดหมวดหมู่ มันจัดเก็บข้อมูลที่มีอยู่และใช้เพื่อวัดความคล้ายคลึงกันในกรณีใหม่
K ใน kNN เป็นพารามิเตอร์ที่หมายถึงจำนวนของเพื่อนบ้านที่ใกล้ที่สุดที่จะถูกรวมอยู่ใน“ส่วนใหญ่การออกเสียงลงคะแนน” ที่ ด้วยวิธีนี้เพื่อนบ้านของแต่ละองค์ประกอบ "โหวต" เพื่อกำหนดระดับของเขา
วิธีที่ดีที่สุดวิธีหนึ่งในการใช้อัลกอริธึม kNN คือเมื่อคุณมีชุดข้อมูลขนาดเล็กที่ปราศจากสัญญาณรบกวนและข้อมูลทั้งหมดในป้ายกำกับ อัลกอริทึมนี้ไม่รวดเร็วและไม่สอนให้รู้จักข้อมูลที่ไม่สะอาด เมื่อชุดข้อมูลมีขนาดใหญ่ขึ้น ไม่ควรใช้ kNN
อัลกอริธึม kNN ทำงานดังนี้: ขั้นแรก พารามิเตอร์ K ถูกระบุ หลังจากนั้นอัลกอริธึมจะสร้างรายการของรายการ ซึ่งอยู่ใกล้กับตัวอย่างข้อมูลใหม่ จากนั้นจะค้นหาการจำแนกประเภทที่พบบ่อยที่สุดของรายการ และสุดท้ายจะจัดประเภทให้กับอินพุตข้อมูลใหม่
ในแง่ของแอปพลิเคชันในชีวิตจริง เครื่องมือค้นหาใช้อัลกอริทึม kNN เพื่อกำหนดว่าผลการค้นหาเกี่ยวข้องกับข้อความค้นหาหรือไม่ พวกเขาเป็นฮีโร่ที่ไม่ได้ร้องซึ่งช่วยประหยัดเวลาผู้ใช้เมื่อทำการค้นหา
ถัดมาต้นไม้ Trio: ถดถอยต้นไม้, สุ่มป่าและ AdaBoost
ไปเลย:
5. ต้นไม้ถดถอย (aka Decision Trees)
ใช่ พวกมันถูกเรียกว่า ต้นไม้ แต่เนื่องจากเรากำลังพูดถึงอัลกอริธึมการเรียนรู้ของเครื่อง ลองนึกภาพพวกมันด้วยรากที่ด้านบน กิ่ง และใบที่ด้านล่าง
ต้นไม้การถดถอย เป็นประเภทของ อัลกอริทึมการเรียนรู้ ภายใต้ การ ดูแล ซึ่งน่าประหลาดใจ ทำงานได้ดีใน Python (อัลกอริทึม ML ส่วนใหญ่ทำอย่างนั้น)
เหล่านี้“ต้นไม้” จะเรียกว่าต้นไม้ตัดสินใจและมีการใช้สำหรับการสร้างแบบจำลองการคาดการณ์ พวกเขาต้องการความพยายามเพียงเล็กน้อยจากผู้ใช้ในแง่ของปริมาณข้อมูลที่ป้อนเข้า
การแสดงตนเป็นต้นไม้ไบนารีและแก้ปัญหาการจำแนกประเภท ตามชื่อที่แนะนำ อัลกอริทึมประเภทนี้ใช้แบบจำลองการตัดสินใจแบบต้นไม้ พวกเขาทำการคัดกรองตัวแปรหรือการเลือกคุณสมบัติ ข้อมูลที่ป้อนเข้าสามารถเป็นได้ทั้งตัวเลขและหมวดหมู่
แปลได้โปรด!
แน่นอน. ทุกครั้งที่คุณตัดสินใจ คุณจะเปลี่ยนไปใช้สถานการณ์ใหม่ - ด้วยการตัดสินใจครั้งใหม่ แต่ละเส้นทางที่เป็นไปได้ที่คุณสามารถทำได้คือ "สาขา" ในขณะที่การตัดสินใจคือ "โหนด" จุดเริ่มต้นเริ่มต้นของคุณคือโหนดหลัก
นั่นเป็นวิธีที่อัลกอริธึมทรีการตัดสินใจสร้างชุดของโหนดและใบไม้ สิ่งสำคัญที่นี่คือทั้งหมดมาจากโหนดเดียว (ในทางตรงกันข้าม อัลกอริธึมของ ฟอเรสต์แบบสุ่ม สร้างต้นไม้จำนวนหนึ่ง แต่ละโหนดมีโหนดหลัก)
ในแง่ของการใช้งานจริง ต้นไม้การถดถอยสามารถใช้ทำนายอัตราการรอดตาย เบี้ยประกัน และราคาอสังหาริมทรัพย์ ขึ้นอยู่กับปัจจัยต่างๆ
ต้นไม้ถดถอย "เติบโต" กิ่งก้านของการตัดสินใจจนกว่าจะถึงเกณฑ์การหยุด มันทำงานได้ดีขึ้นกับข้อมูลอินพุตจำนวนเล็กน้อย เพราะไม่เช่นนั้น คุณอาจได้รับชุดข้อมูลเอาต์พุตแบบเอนเอียง
อัลกอริธึมจะตัดสินใจว่าจะแยกส่วนใดและสร้างสาขาใหม่จากการตัดสินใจ โดยอิงตามอัลกอริธึมหลาย ๆ ตัว ข้อมูลจะถูกแบ่งออกเป็นส่วนต่างๆ ของบันทึกย่อย่อย ซึ่งรวบรวมจากตัวแปรที่มีอยู่ทั้งหมด
6. ป่าสุ่ม
อัลกอริทึมป่าสุ่มเป็นรูปแบบของการเรียนรู้เครื่องภายใต้การดูแลอีก มันสร้างแผนภูมิการตัดสินใจหลายแบบ แทนที่จะเป็นต้นไม้เดียวเหมือนต้นไม้การถดถอย โหนดถูกกระจายแบบสุ่มและลำดับของโหนดไม่มีนัยสำคัญต่อข้อมูลเอาต์พุต ยิ่งจำนวนต้นไม้มากเท่าไร ผลลัพธ์ก็จะยิ่งแม่นยำมากขึ้นเท่านั้น
อัลกอริทึมประเภทนี้สามารถใช้ได้ทั้งการจำแนกประเภทและการถดถอย หนึ่งในคุณสมบัติที่น่ากลัวของอัลกอริทึมป่าสุ่มคือว่ามันสามารถทำงานได้เมื่อเป็นสัดส่วนใหญ่ของข้อมูลจะหายไป นอกจากนี้ยังมีพลังในการทำงานกับชุดข้อมูลขนาดใหญ่
ในกรณีของการถดถอย อัลกอริธึมเหล่านี้ไม่ใช่ทางเลือกที่ดีที่สุด เพราะมันไม่สามารถควบคุมสิ่งที่โมเดลทำได้มากนัก
อัลกอริธึม Random Forest มีประโยชน์มากในอีคอมเมิร์ซ หากคุณต้องการตรวจสอบว่าลูกค้าของคุณจะชอบรองเท้าคู่ใดหรือไม่ คุณจะต้องรวบรวมข้อมูลเกี่ยวกับการซื้อก่อนหน้านี้เท่านั้น
คุณระบุประเภทของรองเท้า ไม่ว่าพวกเขาจะมีส้นรองเท้าหรือไม่ก็ตาม เพศของผู้ซื้อ และช่วงราคาของคู่ก่อนหน้าที่พวกเขาสั่งซื้อ นี่จะเป็นข้อมูลที่ป้อนของคุณ
อัลกอริทึมจะสร้างต้นไม้มากพอที่จะให้ค่าประมาณที่แม่นยำแก่คุณ
ยินดี!
และนี่คืออัลกอริธึมระบบต้นไม้สุดท้าย:
7. AdaBoost
AdaBoost ย่อมาจาก Adaptive Boosting อัลกอริทึมได้รับรางวัล Godel Prize ในปี 2546 สำหรับผู้สร้าง
เช่นเดียวกับสองก่อนหน้านี้ อันนี้ใช้ระบบต้นไม้ด้วย เพียงแทนหลายโหนดและใบไม้ต้นไม้ใน AdaBoost ผลิตเพียง 1 โหนดและ 2 ใบอาคาตอ
อัลกอริทึม AdaBoost แตกต่างอย่างมากจากต้นไม้ตัดสินใจและป่าสุ่ม
มาดูกัน:
ขั้นตอนวิธีต้นไม้ตัดสินใจจะใช้ตัวแปรจำนวนมากก่อนที่จะผลิตออก ตอสามารถใช้ 1 ตัวแปรในการตัดสินใจ
ในกรณีของ อัลกอริธึม ฟอเรสต์แบบสุ่ม ต้นไม้ ทั้งหมดมี ความสำคัญเท่าเทียมกัน สำหรับการตัดสินใจขั้นสุดท้าย อัลกอริธึม AdaBoost กำหนดลำดับความสำคัญให้กับตอไม้บางอย่างเหนือสิ่งอื่นใด
และสุดท้าย แต่ไม่น้อยป่าสุ่มวุ่นวายมากขึ้นเพื่อที่จะพูด หมายความว่าลำดับของต้นไม้ไม่เกี่ยวข้อง ผลลัพธ์ไม่ได้ขึ้นอยู่กับลำดับการผลิตของต้นไม้ ในทางตรงกันข้าม สำหรับอัลกอริธึม AdaBoost ลำดับเป็นสิ่งสำคัญ
ผลของต้นไม้ทุกต้นเป็นพื้นฐานสำหรับต้นต่อไป ดังนั้นหากมีข้อผิดพลาดระหว่างทาง ต้นไม้ทุกต้นที่ตามมาจะได้รับผลกระทบ
เอาล่ะ อัลกอริทึมนี้สามารถทำอะไรในชีวิตจริงได้บ้าง
อัลกอริธึม AdaBoost โดดเด่นในด้านการดูแลสุขภาพ ซึ่งนักวิจัยใช้อัลกอริทึมเหล่านี้ในการวัดความเสี่ยงของโรค คุณมีข้อมูล แต่ปัจจัยต่าง ๆ มีความโน้มถ่วงต่างกัน (ลองนึกภาพคุณล้มทับแขนและแพทย์ใช้อัลกอริทึมในการพิจารณาว่าแขนหักหรือไม่ หากข้อมูลที่ป้อนมีทั้งภาพเอ็กซ์เรย์ที่แขนและรูปถ่ายเล็บที่หักของคุณ… ก็ค่อนข้างชัดเจนว่าตอไม้ไหน จะให้ความสำคัญมากขึ้น)
ตอนนี้เราออกจากป่าแล้ว มาดูอัลกอริธึมการเรียนรู้ของเครื่องอีก 3 ประเภท:
8. อ่าวไร้เดียงสา
สิ่งนี้มีประโยชน์เมื่อคุณมี ปัญหาการ จัดประเภทข้อความ เป็นอัลกอริธึมการเรียนรู้ของเครื่องที่ใช้เมื่อต้องจัดการกับชุดข้อมูลที่มีมิติสูง เช่น การกรองสแปมหรือการจัดประเภทบทความข่าว
อัลกอริทึมมีชื่อลายเซ็นนี้เนื่องจากถือว่าแต่ละตัวแปรเป็นอิสระ กล่าวอีกนัยหนึ่ง จะถือว่าคุณลักษณะต่างๆ ของข้อมูลที่ป้อนเข้านั้นไม่เกี่ยวข้องกันโดยสิ้นเชิง ทำให้เป็นตัวแยกประเภทความน่าจะเป็นที่ง่ายและมีประสิทธิภาพ
ส่วน "Bayes" ของชื่อหมายถึงชายผู้คิดค้นทฤษฎีบทที่ใช้สำหรับอัลกอริทึม กล่าวคือ – Thomas Bayes ทฤษฎีบทของเขา อย่างที่คุณอาจสงสัย จะตรวจสอบความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์
ความน่าจะเป็นคำนวณในสองระดับ อันดับแรก ความน่าจะเป็นของแต่ละชั้น ประการที่สอง ความน่าจะเป็นแบบมีเงื่อนไขตามปัจจัยที่กำหนด
9. การเรียนรู้การหาปริมาณเวกเตอร์
การเรียนรู้ขั้นตอนวิธีเวกเตอร์หรือ LVQ เป็นหนึ่งในขั้นตอนวิธีการเรียนรู้ของเครื่องที่สูงขึ้น
ซึ่งแตกต่างจาก kNN อัลกอริทึม LVQ หมายถึงขั้นตอนวิธีเครือข่ายประสาทเทียม กล่าวอีกนัยหนึ่ง มีจุดมุ่งหมายเพื่อสร้างระบบประสาทของสมองมนุษย์ขึ้นใหม่
อัลกอริธึม LVQ ใช้คอลเลกชั่นของเวกเตอร์สมุดรหัสเป็นตัวแทน โดยพื้นฐานแล้วจะเป็นรายการของตัวเลข ซึ่งมีคุณสมบัติอินพุตและเอาต์พุตเหมือนกันกับข้อมูลการฝึกของคุณ
10. รองรับ Vector Machines
เหล่านี้เป็นหนึ่งในที่สุดขั้นตอนวิธีการเรียนรู้ของเครื่องที่เป็นที่นิยม
อัลกอริทึมการสนับสนุนเวกเตอร์เครื่องเหมาะสำหรับกรณีที่รุนแรงของการจำแนกประเภท ความหมาย – เมื่อขอบเขตการตัดสินใจของข้อมูลที่ป้อนไม่ชัดเจน SVM ทำหน้าที่เป็นเขตแดนที่แยกคลาสอินพุตได้ดีที่สุด
SVM สามารถใช้ในชุดข้อมูลหลายมิติ อัลกอริธึมแปลงสเปซที่ไม่เป็นเชิงเส้นเป็นสเปซเชิงเส้น ใน 2 มิติ คุณสามารถเห็นภาพตัวแปรเป็นเส้นตรง และทำให้ระบุความสัมพันธ์ได้ง่ายขึ้น
มีการใช้ SVM ในหลากหลายสาขาในชีวิตจริงแล้ว:
- ในงานภาพทางการแพทย์และการจำแนกทางการแพทย์
- เพื่อศึกษาคุณภาพอากาศในพื้นที่ที่มีประชากรมาก
- เพื่อช่วยในการวิเคราะห์ทางการเงิน
- ในอัลกอริธึมการจัดอันดับหน้าสำหรับเครื่องมือค้นหา
- สำหรับการจดจำข้อความและวัตถุ
ดูเหมือนว่ามีดสวิสของอัลกอริธึม ML ใช่ไหม
สรุป
มนุษย์และคอมพิวเตอร์สามารถทำงานร่วมกันได้สำเร็จ
นักวิจัยรับรองกับเราว่าการเป็นหุ้นส่วนนี้ สามารถ และ จะ ให้ผลลัพธ์ที่น่าอัศจรรย์ อัลกอริธึมแมชชีนเลิร์นนิงช่วยมนุษยชาติได้หลายวิธีแล้ว
หน้าที่ที่สำคัญที่สุดอย่างหนึ่งของการเรียนรู้ด้วยเครื่องและ อัลกอริธึม AI คือการจำแนกประเภท
มาดูอัลกอริธึมการเรียนรู้ของเครื่อง 10 อันดับแรกอีกครั้งโดยสรุป:
- การถดถอยเชิงเส้น - ใช้ในการสร้างความสัมพันธ์ระหว่าง 2 ตัวแปร - Logistic Regression – ตัวแยกประเภททวินาม มีเพียง 2 ผลลัพธ์ที่เป็นไปได้ของแต่ละแบบสอบถาม
- การวิเคราะห์การเลือกปฏิบัติเชิงเส้น – ทำงานได้ดีที่สุดสำหรับการจำแนกข้อมูลตามหมวดหมู่ที่รู้จัก
- K-Nearest Neighbor – จำแนกข้อมูลออกเป็นหมวดหมู่
- ต้นไม้ถดถอย – ใช้สำหรับการสร้างแบบจำลองการทำนาย
- Random Forest – ใช้กับชุดข้อมูลขนาดใหญ่ และเมื่อข้อมูลอินพุตส่วนใหญ่หายไป
- AdaBoost – การจำแนกประเภทไบนารี
- Naive Bayes – การสร้างแบบจำลองการคาดการณ์
- Learning Vector Quantization – อัลกอริธึมโครงข่ายประสาทเทียม
- รองรับ Vector Machines – กรณีการจัดประเภทที่รุนแรงในชุดข้อมูลหลายมิติ
อัลกอริธึมทั้งหมดเหล่านี้ (รวมถึงอัลกอริธึมใหม่ที่ยังมาไม่ถึง) จะวางรากฐานสำหรับยุคใหม่แห่งความเจริญรุ่งเรืองสำหรับมนุษยชาติ มันจะทำให้เป็นไปได้ (และจำเป็น) รายได้พื้นฐานสากล เพื่อให้แน่ใจว่าคนที่มีความสามารถน้อยกว่าจะอยู่รอด (ใครจะไปก่อกบฏและทำให้สังคมของเราวุ่นวาย เออ..)
ใครจะคิดว่าบทความเกี่ยวกับ อัลกอริธึมการเรียนรู้ของเครื่อง จะดูไร้ สาระ นั่นคือสำหรับวันนี้
แล้วเจอกันนะพวก!
คำถามที่พบบ่อย
แมชชีนเลิร์นนิงนั้นยอดเยี่ยมและให้ความกระจ่างเกี่ยวกับอนาคตของเทคโนโลยี ที่มากับค่าใช้จ่ายบางอย่าง ตัวอย่างเช่น คอมพิวเตอร์ที่โฮสต์โปรแกรมแมชชีนเลิร์นนิงใช้ไฟฟ้าและทรัพยากรในปริมาณมาก ข้อบกพร่องอีกประการหนึ่งของแมชชีนเลิร์นนิงจนถึงขณะนี้คือการแก้ความกำกวมเอนทิตีเป็นครั้งคราว บางครั้งเครื่องจักรก็แยกไม่ออกระหว่างชื่อแอนน์ แฮททาเวย์ กับมูลค่าหุ้นของเบิร์กเชียร์ แฮททาเวย์ ทุกครั้งที่นักแสดงได้รับความสนใจจากสื่อ บริษัทก็จะได้เงิน...
การเรียนรู้ของเครื่องเป็นวิธีการคำนวณ แม้ว่าอัลกอริธึม "ดั้งเดิม" จะต้องการโปรแกรมเมอร์ในการเขียน แต่อัลกอริทึมของแมชชีนเลิร์นนิงนั้นฝึกฝนตนเองเป็นหลัก ใช่ ไม่ล้อเล่น!
ขึ้นอยู่กับงานที่คุณต้องทำ การเลือกอัลกอริธึมที่ดีที่สุดสำหรับงานในมือนั้นขึ้นอยู่กับขนาด คุณภาพ และความหลากหลายของอินพุตของคุณ ตลอดจนชนิดของข้อมูลเอาท์พุตที่ผู้ใช้ร้องขอ
เช่นเดียวกับสิ่งอื่น ๆ กระบวนการเริ่มต้นด้วยการทำความรู้จักพื้นฐานของอัลกอริทึมที่คุณเลือกสำหรับปัญหาของคุณ คุณจะต้องปรึกษาแหล่งเรียนรู้ต่างๆ และเลือกแหล่งการเรียนรู้ที่เหมาะกับคุณที่สุด จากนั้นเริ่มต้นด้วยการแบ่งอัลกอริทึมออกเป็นหน่วยเล็กๆ เริ่มต้นด้วยตัวอย่างง่ายๆ และเมื่อคุณเข้าใจในสิ่งต่างๆ ได้ คุณจะตรวจสอบด้วยการใช้งานที่เชื่อถือได้ แล้วคุณทำกระบวนการทั้งหมดให้เสร็จสิ้น มันอาจจะฟังดูยากกว่าที่เป็นอยู่ แต่ก็คุ้มค่าที่จะลอง!