อัลกอริธึมการเรียนรู้ของเครื่อง 10 อันดับแรก: เหตุใดจึงมีความสำคัญในปี 2564

เผยแพร่แล้ว: 2019-06-10
สารบัญ
  • ลงหลุมกระต่ายของแมชชีนเลิร์นนิง

  • แอปพลิเคชั่นในชีวิตจริง

  • อัลกอริธึมการเรียนรู้ของเครื่องหมายถึงอะไร

  • ประเภทของการเรียนรู้ของเครื่อง

  • อัลกอริทึมการเรียนรู้ของเครื่อง 10 อันดับแรก

  • สรุป

  • ในปี 2564 คอมพิวเตอร์ไม่เพียงแต่ มองเห็น แต่สามารถ อ่าน และ เขียน เองได้ด้วย

    มาดูเรื่องราวสยองขวัญสมัยใหม่ที่เราอาศัยอยู่กัน

    ตัวอย่างเช่น คุณจะตอบสนองอย่างไรถ้ามีคนบอกคุณว่าอีก 30% ของงานจะถูกแทนที่ด้วยระบบอัตโนมัติ มันอุกอาจใช่มั้ย?

    แล้วมันเกี่ยวอะไรกับ อัลกอริธึมการเรียนรู้ของเครื่อง ?

    โชคดีที่มีแสงสว่างที่ปลายอุโมงค์ ให้ฉันแนะนำคุณผ่านมัน

    ในปี 2021 คอมพิวเตอร์สามารถ:

    • จดจำเสียง ใบหน้า และลายมือ (สไตล์ซีเอสไอ…)
    • คำบรรยายภาพโดยอัตโนมัติ
    • เรียนรู้วิธีจดจำเนื้อหาของรูปภาพและจำแนกตามคุณสมบัติเฉพาะ
    • ทำงานให้คุณ (และสร้างอัลกอริธึมที่จำเป็นเพื่อดึงออกมา)

    รายการดำเนินต่อไปแน่นอน

    ทุกวันเราทำการค้นหาเว็บ เยี่ยมชมเว็บไซต์และโซเชียลมีเดีย และเราไม่เคยถามตัวเองด้วยคำถามพื้นฐาน:

    เทคโนโลยี AI ไปไกลแค่ไหน?

    ไปเลย!

    ความสำเร็จของเทคโนโลยีทำให้เกิดคำถามเกี่ยวกับอนาคตของมนุษยชาติ

    บางทีข้อเท็จจริงเหล่านี้อาจให้ข้อมูลเชิงลึกแก่เรา:

    (ที่มา: อนาคต , ดีไซร์ )

    • ในเกาหลีใต้ออกจากทุก 100 คน, 4.78 ค่าเฉลี่ยเป็นหุ่นยนต์
    • 88% ของพนักงานในเอธิโอเปียมีความเสี่ยงที่จะตกงานให้กับหุ่นยนต์
    • ในนิวยอร์กซิตี้, พนักงานที่ใกล้สูญพันธุ์เป็น 40.7%
    • ต้องใช้โค้ด 9 บรรทัด ในการเขียนโปรแกรมแมชชีนเลิร์นนิง
    • 97% ของงานทำอาหารจานด่วนจะถูกแทนที่ด้วยเครื่องจักร
    • เกษตรกร 98% จะตกงานให้กับเครื่องจักร
    • แมชชีนเลิร์นนิงสามารถสร้างรายได้สูงถึง 1 พันล้านดอลลาร์ ต่อปีในอุตสาหกรรมยา
    • ใน 10 ปีข้างหน้าการเรียนรู้เครื่องคาดว่าจะเข้ามาแทนที่ 25% ของงาน

    ในปี 2564 เราสามารถเป็นเจ้าของหุ่นยนต์ได้ที่บ้าน

    คุณสามารถมีการสนทนาได้อย่างคล่องแคล่วด้วย Jibo หรือ Tapia พวกมันถูกเรียกว่า หุ่นยนต์โซเชียล ด้วยเหตุผล

    พวกเขาจำชื่อ ใบหน้า และเสียงของเพื่อนและสมาชิกในครอบครัวของคุณ (ซึ่งไม่น่ากลัวเลย!) พวกเขาสามารถดูแลลูกของคุณได้ (ใช่แล้ว!) และหากคุณประสบอุบัติเหตุที่บ้าน พวกเขาจะโทรหา 911 เพื่อ คุณ. อันสุดท้ายนั้นมีประโยชน์อย่างยิ่งเมื่อไม่มีใครอยู่ใกล้ๆ แต่เราจะพูดถึงเรื่องนี้ในภายหลัง

    ทุกวันนี้ อัลกอริธึมสามารถ "สอนตัวเอง" ภาษา และแม้แต่แปลที่พูดภาษาอังกฤษเป็นภาษาจีนเขียนพร้อมกันด้วยความคล่องแคล่วของผู้พูดภาษาจีนโดยเฉลี่ย ไม่ช้าก็เร็วการเรียนภาษาต่างประเทศจะล้าสมัยอย่างหลีกเลี่ยงไม่ได้

    แล้วเรื่องนี้ล่ะ:

    สมาร์ทโฟนของเรากำลังสอดแนมเราอย่างแท้จริง… ฉันแน่ใจว่าคุณรู้แน่ชัดว่าฉันกำลังพูดถึงอะไร! ลองนึกภาพ - ที่รับประทานอาหารกลางวันที่สำนักงานคุณพูดถึงคุณต้องการที่จะเริ่มต้นดูลูซิเฟอร์ (วาจา) กลับมาที่โต๊ะทำงานของคุณ คุณเปิด Pinterest หรือ Facebook บนโทรศัพท์ของคุณ และนั่นคือเขา – ปีศาจเอง… (ใช่ ทอม เอลลิสเป็นคนช่างฝัน แต่นั่นไม่ใช่ประเด็น!)

    ระบบคำแนะนำอยู่รอบตัวเรา หากคุณป้อนการค้นหา "Lego" รูปภาพที่เกี่ยวข้องซึ่งปรากฏขึ้นและจัดอยู่ในประเภท Lego ได้รับการยอมรับโดย AI กล่าวอีกนัยหนึ่ง พวกเขาไม่ได้ใส่คำอธิบายประกอบด้วยตนเองเป็นบล็อกเลโก้ โดยมนุษย์...

    อัลกอริธึมได้สอนตัวเอง ว่าสิ่ง นี้คือ อะไร โดยดูจากภาพหลายล้านภาพ

    ขนลุก!

    ความสามารถทั้งหมดเหล่านั้นและอื่น ๆ อีกมากมาย ถูกนำไปใช้โดยบริษัทต่างๆ แล้ว

    ความหมายที่นี่คือ:

    ครั้งแรกที่คอมพิวเตอร์แล้วมีอำนาจที่จะสร้างอัลกอริทึมของ AI สอนตัวเอง เถอะพวก! คิดถึงคนงานหุ่นยนต์ทั้งหมดในอนาคต พวกเขาจะเรียนรู้และปฏิบัติงานได้เร็วกว่าคนงานที่เป็นมนุษย์

    และอย่าง ที่สอง – ฉันรู้ว่าคุณกำลังคิดอะไรอยู่ – OMG มนุษยชาติถึงวาระแล้ว!

    หลายคนมีปฏิกิริยาเช่นนี้

    ผู้เขียนหลายคนในช่วงศตวรรษที่ผ่านมาได้เขียนเกี่ยวกับอนาคตที่หุ่นยนต์ครอบงำมนุษย์ ปัญญาประดิษฐ์กำลังเฟื่องฟู หุ่นยนต์จะครองโลกและกินมนุษย์ ภาวะเอกฐานอยู่ใกล้

    ตกลง นี้เป็นสถานที่ที่ดีที่จะหยุด

    ตอนนี้เราได้สิ่งนั้นออกจากระบบแล้ว มาดูกันว่าอะไรจริงตามข้อเท็จจริง

    ลงหลุมกระต่ายของแมชชีนเลิร์นนิง

    เราต้องการบริบทก่อน

    15,000 ปีที่แล้วมีการประดิษฐ์เกมที่เป็นที่รักมากที่สุดในโลกเกมหนึ่ง ที่ไหนสักแห่งระหว่างวันที่ 12 และศตวรรษที่ 14 เกมที่กลายเป็นที่รู้จักหมากรุก

    มี 10 ยกกำลัง 40 ผลลัพธ์ที่เป็นไปได้ (นั่นคือ 1 โดยมีศูนย์ 40 ตัวในตอนท้าย)

    ในปี 2560 อัลกอริธึม AlphaZero ของ Google ใช้ แมชชีนเลิร์นนิง เพื่อสอนตัวเองให้เล่นและชนะเกม

    กระบวนการทั้งหมด ตั้งแต่การแนะนำเกมไปจนถึงอัลกอริธึม จนกระทั่งมันชนะเกมแรกกับ Stockfish ซึ่งเป็นหนึ่งในเครื่องมือหมากรุกที่แข็งแกร่งที่สุดในโลก

    (รั้งตัวเอง!)

    4 ชั่วโมง.

    อุ๊ย!

    ใช่ เราใกล้จะถึง การปฏิวัติการเรียนรู้ ของ เครื่อง แล้ว

    เมื่อมองย้อนกลับไป นี่ไม่ใช่การหยุดชะงักครั้งแรกของประเภทนี้ การปฏิวัติอุตสาหกรรมในช่วงปลายศตวรรษที่ 19 และต้นศตวรรษที่ 20 ได้ก่อให้เกิดการหยุดชะงักทางสังคมเช่นกัน แต่ในที่สุด มนุษยชาติและเครื่องจักรก็บรรลุความสมดุล

    ใช่ สิ่งต่าง ๆ กำลังเปลี่ยนแปลง และนั่นก็เป็นสิ่งที่ดีจริงๆ!

    ซอฟต์แวร์แมชชีนเลิร์นนิงมีพลังในการมองปัญหาด้วยสายตาที่สดใสและนำทางผ่านสภาพแวดล้อมที่ไม่รู้จัก

    อย่างที่เรากำลังจะได้เห็น มันไม่ใช่เรื่องราวสยองขวัญอีกต่อไป

    เหมือนปาฏิหาริย์ทางเทคโนโลยี

    ตอนนี้:

    ทำไมการจำแนกประเภทจึงมีความสำคัญ?

    สำหรับผู้เริ่มต้น แมชชีนเลิร์นนิง ตาม คำจำกัดความ คืออะไร

    โดยพื้นฐานแล้ว เครื่องได้รับการตั้งโปรแกรมให้สอนตัวเองถึงวิธีสร้างโปรแกรมและสร้างโซลูชัน แมชชีนเลิร์นนิงจะสร้างตัวเลขที่แม่นยำที่สุดเสมอ (และหากจำเป็น – การคาดคะเน) ที่เป็นไปได้

    ลองนึกถึงเทคโนโลยีที่สามารถแก้ปัญหาต่างๆ ได้หลากหลายโดยสิ้นเชิง

    และนั่นคือความงามของมัน!

    วัตถุประสงค์หลักของระบบคือการจำแนก นี้จะเรียกว่าวิสัยทัศน์คอมพิวเตอร์ มันจะเรียนรู้ด้วยตัวเองเพื่อสร้างความแตกต่าง และจำนวนปัญหาต่างๆ ในโลกที่สามารถลดเหลือเป็นงานการจำแนกที่ดูเหมือนง่าย ๆ ได้นั้นเป็นเรื่องที่น่าคิดมาก

    ลองนึกภาพความสามารถในการจำแนกระหว่าง:

    • ตำแหน่งหมากรุกที่ดีและไม่ดี (เกม)
    • ประโยคที่ถูกต้องและไม่ถูกต้องตามหลักไวยากรณ์ (แปล)
    • ถนนที่ว่างเปล่าและถนนที่มีรถยนต์หรือคนเดินเท้า (รถยนต์ที่ขับเอง)
    • เซลล์ที่แข็งแรงและเซลล์มะเร็ง (การวินิจฉัยทางการแพทย์)

    นั่นเป็นสาเหตุว่าทำไมผู้เชี่ยวชาญในหลาย ๆ ด้านจึงล้าสมัย คุณไม่จำเป็นต้องเป็นผู้เชี่ยวชาญในการสร้างโค้ดที่จะทำงานดังกล่าว พวกที่เขียนโปรแกรมแปลภาษาอังกฤษเป็นจีนพร้อมกันไม่ได้พูดภาษาจีนเลย

    อัลกอริทึมจะสอนตัวเองถึงวิธีการเป็นผู้เชี่ยวชาญ

    และใช่ สิ่งสำคัญคือต้องเรียนรู้เกี่ยวกับสิ่งเหล่านี้และทำความรู้จักกับพวกเขา… วิธีที่เราได้รู้จักคอมพิวเตอร์ในตอนแรก

    เราเก่งเรื่องคอมพิวเตอร์แล้ว ดีมากที่เรามักจะทำให้เป็นมนุษย์ (หรืออาจจะเป็นแค่ฉัน?)

    ดูเหมือนว่านี่เป็นเวลาที่จะถามตัวเองว่า

    จะเกิดอะไรขึ้นกับคนเหล่านั้นที่จะตกงานในโปรแกรม AI และแมชชีนเลิร์นนิงในที่สุด?

    คุณเคยได้ยินเรื่องเล็กๆ น้อยๆ ที่เรียกว่า Universal Basic Income หรือไม่?

    นี่มันไป:

    ในอนาคตประชาชนจะมีรายได้ที่ไม่เกี่ยวข้องกับการทำงานใดๆ เงินจะมาจากประสิทธิภาพที่บ้าคลั่งที่ระบบอัตโนมัติจะให้และการประหยัดที่มาจากมัน

    ไม่ว่าจะเป็นสิ่งนี้หรือ - สถานการณ์ที่สมจริงกว่าเล็กน้อย - งานประเภทใหม่มากมายจะปรากฏขึ้น ในช่วงปลายศตวรรษที่ 19 ประมาณ 50% ของประชากรในสหรัฐอเมริกาเกี่ยวข้องกับการเกษตร ตอนนี้ต้องขอบคุณเครื่องจักรอันทรงพลังที่ทำให้มีเกษตรกรน้อยกว่า 2% แต่ยังมีคนจ้างงานอยู่

    แล้ว แมชชีนเลิร์นนิงใช้ทำ อะไรได้บ้าง ?

    แอปพลิเคชั่นในชีวิตจริง

    สามารถใช้แมชชีนเลิร์นนิงเพื่ออนุมานข้อเท็จจริงใหม่จากฐานข้อมูลได้

    ลองมาดูบางส่วนของพื้นที่ที่มีการเรียนรู้เครื่องจะสร้างความแตกต่างที่ดี:

    • ระบบช่วยขับขี่ – รถยนต์สามารถเหยียบเบรกให้คุณโดยอัตโนมัติ เมื่อคุณเข้าใกล้รถคันข้างหน้า และด้วยเหตุนี้ ณ จุดใดจุดหนึ่งในอนาคต มนุษยชาติเกือบจะลืมว่า อุบัติเหตุทางรถยนต์ หมายถึงอะไร รถยนต์ไร้คนขับกำลังเดินทาง
    • การดูแลสุขภาพ – เพิ่มประสิทธิภาพของบุคลากรทางการแพทย์ การรับรู้และการวินิจฉัยโรคจะง่ายขึ้นและแม่นยำยิ่งขึ้นด้วยความช่วยเหลือของการเรียนรู้ของเครื่อง ตัวอย่างเช่น โปรแกรมไม่เพียงแต่สแกนและระบุภาพเนื้อเยื่อมะเร็งได้ดีกว่ามนุษย์เท่านั้น แต่ยังสามารถคำนวณอัตราการรอดชีวิตของผู้ป่วยตามฐานข้อมูลขนาดใหญ่ของเวชระเบียน (ตรวจสอบผลงานของ Jeremy Howard และโครงการของเขาที่ชื่อว่า Enlitic น่าทึ่งมาก!)
    • การประดิษฐ์ยา – ด้วยความช่วยเหลือของการเรียนรู้ด้วยเครื่อง ผู้ป่วยแต่ละรายสามารถรับการรักษาที่ออกแบบมาโดยเฉพาะสำหรับเขา
    • เกษตรกรรม – การทำฟาร์มจะเป็นไปโดยอัตโนมัติด้วยคอมพิวเตอร์วิทัศน์และการควบคุมด้วยหุ่นยนต์: คุณภาพและการทำนายผล การตรวจหาโรค สวัสดิภาพปศุสัตว์ และการผลิต
    • ความสามารถในการใช้ภาษา AI ขับเคลื่อน - ในอนาคตอันใกล้เราจะสามารถที่จะสื่อสารด้วยวาจากับการแปลแบบ real-time โดยใช้ AI

    แมชชีนเลิร์นนิงเป็นเพียงเครื่องมือ และจะยังคงเป็นเครื่องมือหนึ่งในอนาคตอันใกล้

    ดังนั้นไม่ต้องกังวล เอนหลังและผ่อนคลาย

    ตอนนี้เราได้เห็นแล้วว่าแมชชีนเลิร์นนิงคืออะไร เรามาถามคำถามต่อไปกัน:

    อัลกอริธึมการเรียนรู้ของเครื่องหมายถึงอะไร

    ดังนั้น หลังจากที่เรากำหนดว่าแมชชีนเลิร์นนิงมีความสำคัญและเป็นประโยชน์ต่อการเรียนรู้ของเครื่องในอนาคตมากเพียงใด มาดูอัลกอริธึมที่ทำให้เวทมนตร์เกิดขึ้นอย่างละเอียดยิ่งขึ้น

    วิธีที่ยอดเยี่ยมในการอธิบายอัลกอริธึมการเรียนรู้ของเครื่องคือการ เปรียบเทียบ กับการเขียนโปรแกรมแบบดั้งเดิม

    ใน การเขียนโปรแกรมแบบดั้งเดิม โปรแกรมเมอร์ ทำงานในทีมที่มีผู้เชี่ยวชาญในสาขานั้นๆ ซึ่งซอฟต์แวร์กำลังอยู่ระหว่างการพัฒนา ยิ่งงานซับซ้อน - รหัสยิ่งยาวและเขียนยากขึ้นเท่านั้น

    อัลกอริธึมการเรียนรู้ของเครื่อง ทำงานค่อนข้างแตกต่าง อัลกอริธึมรับชุดข้อมูลสำหรับอินพุต – และชุดข้อมูล เสริม สำหรับเอาต์พุต จากนั้นวิเคราะห์ (หรือพวกเขา) และ ดำเนินการตามกระบวนการที่ต้องเกิดขึ้นเพื่อให้ได้ผลลัพธ์ที่เป็นประโยชน์ วันนี้เป็นงานที่สงวนไว้สำหรับโปรแกรมเมอร์ที่เป็นมนุษย์ ในอนาคตก็จะเปลี่ยนไปเช่นกัน

    ประเภทของการเรียนรู้ของเครื่อง

    อัลกอริธึม การเรียนรู้ของเครื่อง มี 4 ประเภท

    นี่คือ:

    1. การเรียนรู้ภายใต้การดูแล

    ข้อมูลอินพุตในอัลกอริธึมการเรียนรู้ภายใต้การดูแลจะมีป้ายกำกับ และเอาต์พุตเป็นที่รู้จักและถูกต้อง ในการใช้อัลกอริธึมคลาสนี้ คุณจะต้องมีข้อมูลที่มีป้ายกำกับจำนวนมาก และนั่นอาจไม่ใช่เรื่องง่ายเสมอไป

    ขั้นตอนวิธีการภายใต้การดูแลตกอยู่ในสองประเภท - การถดถอยและการจำแนก แต่ละคนตรวจสอบชุดข้อมูลที่แตกต่างกัน

    อัลกอริธึมการถดถอยคือสิ่งที่คาดการณ์และคาดการณ์ ข้อมูลเหล่านี้รวมถึงการพยากรณ์อากาศ การเติบโตของประชากร การคาดคะเนอายุขัย การคาดการณ์ของตลาด

    อัลกอริธึมการจำแนกประเภทใช้สำหรับการวินิจฉัย การตรวจจับการปลอมแปลงข้อมูลประจำตัว การรักษาลูกค้า และการจัดประเภทรูปภาพตามชื่อที่แนะนำ

    2. การเรียนรู้แบบไม่มีผู้ดูแล

    เกิดขึ้นเมื่อข้อมูลอินพุตไม่มีป้ายกำกับ พวกเขาจัดระเบียบข้อมูลเป็นโครงสร้างของคลัสเตอร์ ดังนั้นข้อมูลที่ป้อนเข้าจึงพร้อมสำหรับการวิเคราะห์ทันที

    เนื่องจากไม่มีการระบุข้อมูล จึงไม่มีทางประเมินความถูกต้องของผลลัพธ์ได้ ที่กล่าวว่าไม่ใช่ความถูกต้องที่อัลกอริธึมที่ไม่มีการควบคุมได้รับการออกแบบมาเพื่อติดตาม คลัสเตอร์ที่อัลกอริทึมสร้างขึ้นนั้นไม่คุ้นเคยกับโปรแกรม แนวคิดคือการป้อนข้อมูล วิเคราะห์ และจัดกลุ่มเป็นกลุ่ม

    เช่นเดียวกับขั้นตอนวิธีการภายใต้การดูแลญาติใกล้ชิดของพวกเขาจะถูกแบ่งออกเป็น 2 ประเภท - การลดมิติและการจัดกลุ่ม

    อัลกอริธึมการทำคลัสเตอร์เองเป็นส่วนหนึ่งของสิ่งนี้อย่างชัดเจน การจัดกลุ่มข้อมูลเป็นหมวดหมู่มีประโยชน์ ดังนั้นคุณจึงไม่ต้องจัดการทีละส่วน อัลกอริธึมเหล่านี้ใช้เหนือสิ่งอื่นใดสำหรับการแบ่งส่วนลูกค้าและการตลาดแบบกำหนดเป้าหมาย

    อัลกอริธึมการลดมิติใช้สำหรับการค้นพบโครงสร้าง การสร้างภาพข้อมูลขนาดใหญ่ การแสดงคุณลักษณะ และการบีบอัดที่มีความหมาย หากการรวมกลุ่มเป็นด้านหนึ่งของเหรียญ การลดมิติจะเป็นอีกด้านหนึ่ง โดยการจัดกลุ่มข้อมูลออกเป็นคลัสเตอร์ อัลกอริธึมจะลดจำนวนตัวแปรที่มีความหมาย (มิติ) ที่อธิบายชุดข้อมูลอย่างหลีกเลี่ยงไม่ได้

    ขณะนี้ มีคลาสของอัลกอริธึมการเรียนรู้ของเครื่องที่รวม 2 คลาสก่อนหน้านี้:

    3. การเรียนรู้กึ่งควบคุม

    มันยืนอยู่ภายใต้การดูแลระหว่างที่มีข้อมูลที่มีข้อความและขั้นตอนวิธีการใกล้ชิดกับข้อมูลที่ไม่มีป้ายกำกับ

    อัลกอริธึมกึ่งควบคุมจะใช้ข้อมูลที่มีป้ายกำกับจำนวนเล็กน้อยและข้อมูลที่ไม่มีป้ายกำกับจำนวนมาก สิ่งนี้สามารถนำไปสู่การปรับปรุงความแม่นยำในการเรียนรู้

    นอกจากนี้ยังเป็นการบรรเทาอย่างมากในแง่ของการรวบรวมข้อมูลเนื่องจากต้องใช้ทรัพยากรจำนวนมากเพื่อสร้างข้อมูลที่มีป้ายกำกับ

    4. การเรียนรู้การเสริมแรง

    อัลกอริธึมการเสริมแรงจะเลือกการดำเนินการตามชุดข้อมูลไม่เหมือนกับ 3 ประเภทก่อนหน้า จากนั้นพวกเขาจะประเมินผลลัพธ์และเปลี่ยนกลยุทธ์หากจำเป็น

    ในอัลกอริธึมการเสริมแรง คุณสร้างเครือข่ายและวงจรของการกระทำ เท่านี้ก็เรียบร้อย โดยไม่ต้องสร้างฐานข้อมูล คุณมีผู้ชนะ ทำไม?

    มันเป็นอัลกอริธึมการเสริมกำลังที่คิดหาเกมหมากฮอส หมากรุก และโก

    งานเรียนรู้การเสริมแรงบนหลักการลองผิดลองถูก ระบบจะได้รับรางวัลบางอย่างที่จะช่วยวัดอัตราความสำเร็จ ในกรณีของเกม – รางวัลจะเป็นกระดานคะแนน เมื่อใดก็ตามที่ระบบได้คะแนน ระบบจะประเมินว่าเป็นการย้ายที่ประสบความสำเร็จและสถานะของการย้ายนี้จะสูงขึ้น มันจะวนซ้ำไปเรื่อยๆ จนกว่าการเคลื่อนไหวทั้งหมดจะสำเร็จ

    และนั่นคือวิธีที่เรามีอัลกอริธึมที่สามารถควบคุมเกมหมากรุกได้ภายใน 4 ชั่วโมง

    ตอนนี้เรารู้แล้ว!

    ไม่เป็นอะไร. มาดูอัลกอริธึมกัน:

    อัลกอริทึมการเรียนรู้ของเครื่อง 10 อันดับแรก

    ก่อนที่เราจะเริ่มต้น มาดูหนึ่งในแนวคิดหลักในการเรียนรู้ของเครื่องกันก่อน ถดถอยเมื่อมันมาถึงขั้นตอนวิธีการเรียนรู้เครื่องถดถอยหมายความว่าอัลกอริทึมจะพยายามที่จะสร้างความสัมพันธ์ระหว่างสองตัวแปร

    การถดถอยมีหลายประเภท – การถดถอยเชิงเส้น โลจิสติก พหุนาม การถดถอยกำลังสองน้อยที่สุดสามัญ และอื่นๆ วันนี้เราจะมาพูดถึง 2 ประเภทแรกกัน เพราะไม่เช่นนั้นจะตีพิมพ์เป็นหนังสือได้ดีกว่าบทความ

    อย่างที่เราจะได้เห็นกันในอีกสักครู่ อัลกอริธึม 10 อันดับแรกส่วนใหญ่เป็นอัลกอริธึมการเรียนรู้ภายใต้การดูแลและใช้กับ Python ได้ดีที่สุด

    รายชื่ออัลกอริธึมการเรียนรู้ของเครื่อง 10 อันดับแรก มา ดังนี้:

    1. การถดถอยเชิงเส้น

    เป็นหนึ่งในอัลกอริธึมการเรียนรู้ของเครื่องที่ได้รับความนิยมมากที่สุด มันทำงานเพื่อสร้างความสัมพันธ์ระหว่างสองตัวแปรโดยปรับสมการเชิงเส้นให้เหมาะสมผ่านข้อมูลที่สังเกตได้

    กล่าวอีกนัยหนึ่ง อัลกอริธึมประเภทนี้จะสังเกตคุณลักษณะต่างๆ เพื่อที่จะได้ข้อสรุป หากจำนวนตัวแปรมากกว่า 2 ตัว อัลกอริทึมจะเรียกว่าการถดถอยเชิงเส้นพหุคูณ

    การถดถอยเชิงเส้นยังเป็นหนึ่งในขั้นตอนวิธีการเรียนรู้ของเครื่องภายใต้การดูแลการทำงานที่ดีในหลาม เป็นเครื่องมือทางสถิติที่มีประสิทธิภาพและสามารถนำไปใช้ในการทำนายพฤติกรรมผู้บริโภค ประมาณการการพยากรณ์ และการประเมินแนวโน้ม บริษัทจะได้รับประโยชน์จากการวิเคราะห์เชิงเส้นและคาดการณ์ยอดขายในช่วงระยะเวลาหนึ่งในอนาคต

    ดังนั้นถ้าเรามีสองตัวแปรหนึ่งในนั้นคือการอธิบายและอื่นที่เป็นขึ้นอยู่กับ ตัวแปรตามแสดงถึงค่าที่คุณต้องการค้นคว้าหรือคาดการณ์ ตัวแปรอธิบายเป็นอิสระ ตัวแปรตามจะนับตามคำอธิบายเสมอ

    จุดประสงค์ของการเรียนรู้ของเครื่องเชิงเส้นตรงคือการดูว่าตัวแปรทั้งสองมีความสัมพันธ์กันอย่างมีนัยสำคัญหรือไม่ และถ้ามี เพื่อดูว่าตัวแปรนั้นแสดงถึงอะไร

    การถดถอยเชิงเส้นถือเป็นอัลกอริธึมการเรียนรู้ของเครื่องอย่างง่าย ดังนั้นจึงเป็นที่นิยมในหมู่นักวิทยาศาสตร์

    ตอนนี้ มีการถดถอยเชิงเส้น และมีการถดถอยโลจิสติก มาดูความแตกต่างกัน:

    2. การถดถอยโลจิสติก

    นี้เป็นหนึ่งในขั้นตอนวิธีการเรียนรู้ของเครื่องขั้นพื้นฐาน มันเป็นลักษณนามทวินามที่มีเพียง 2 รัฐหรือ 2 ค่า - ข้อมูลที่ป้อนเข้าจะถูกบีบอัดและวิเคราะห์แล้ว

    อัลกอริธึมลอจิสติกต่างจากการถดถอยเชิงเส้นตรงจากการทำนายโดยใช้ฟังก์ชันไม่เชิงเส้น อัลกอริทึมการถดถอยโลจิสติกใช้สำหรับการจัดประเภทไม่ใช่สำหรับงานถดถอย "การถดถอย" ในชื่อแนะนำว่าอัลกอริธึมใช้โมเดลเชิงเส้นและรวมเข้ากับพื้นที่ในอนาคต

    การถดถอยโลจิสติกเป็น อัลกอริธึมแมชชีนเลิร์นนิงที่ มีการ ควบคุมดูแล ซึ่งก็เหมือนกับการถดถอยเชิงเส้น ซึ่งทำงานได้ดีใน Python จากมุมมองทางคณิตศาสตร์ หากข้อมูลที่ส่งออกของการวิจัยคาดว่าจะเป็นผู้ป่วย/สุขภาพ หรือมะเร็ง/ไม่มีมะเร็ง การถดถอยโลจิสติกเป็นอัลกอริธึมที่สมบูรณ์แบบ

    ซึ่งแตกต่างจากการถดถอยเชิงเส้นที่ข้อมูลเอาต์พุตอาจมีค่าต่างกัน การถดถอยโลจิสติกสามารถมีเอาต์พุตได้เพียง 1 และ 0 เท่านั้น

    การถดถอยโลจิสติกมี 3 ประเภท ขึ้นอยู่กับการตอบสนองอย่างเด็ดขาด เหล่านี้คือ:

    • การถดถอยโลจิสติกแบบไบนารี – นี่เป็นประเภทที่ใช้บ่อยที่สุดหากผลลัพธ์เป็น "ใช่"/"ไม่ใช่" ที่หลากหลาย
    • การถดถอยโลจิสติกแบบพหุ นาม – เมื่อมีความเป็นไปได้ 3 คำตอบขึ้นไปโดยไม่มีการเรียงลำดับ
    • การถดถอยโลจิสติกลำดับ – อีกครั้ง 3 หรือมากกว่าคำตอบ แต่มีการสั่งซื้อ ตัวอย่างเช่น เมื่อผลลัพธ์ที่คาดหวังอยู่ในระดับ 1 ถึง 10

    มาดูอัลกอริธึมการจำแนกที่ยอดเยี่ยมอื่น:

    3. การวิเคราะห์การเลือกปฏิบัติเชิงเส้น

    วิธีนี้จะค้นหาการผสมผสานของคุณสมบัติเชิงเส้น ซึ่งแยกข้อมูลอินพุตที่ต่างกันออกไป จุดประสงค์ของอัลกอริธึม LDA คือการตรวจสอบตัวแปรที่เชื่อถือได้ว่าเป็นการรวมเชิงเส้นของคุณลักษณะ มันเป็นเทคนิคการจัดหมวดหมู่ที่ดี

    อัลกอริธึมนี้จะตรวจสอบคุณภาพทางสถิติของข้อมูลที่ป้อนเข้า และทำการคำนวณสำหรับแต่ละคลาส มันวัดค่าของคลาสแล้วค่าความแปรปรวนระหว่างคลาสทั้งหมด

    ในระหว่างกระบวนการสร้างแบบจำลองความแตกต่างระหว่างคลาส อัลกอริธึมจะตรวจสอบข้อมูลอินพุตตามตัวแปรอิสระ

    ข้อมูลที่ส่งออกมีข้อมูลเกี่ยวกับคลาสที่มีค่าสูงสุด การทำงานจำแนกเชิงเส้นการวิเคราะห์ขั้นตอนวิธีการที่ดีที่สุดสำหรับการแยกประเภทที่รู้จักกันในหมู่ เมื่อปัจจัยหลายอย่างจำเป็นต้องแบ่งตามหมวดหมู่ทางคณิตศาสตร์ เราใช้อัลกอริทึม LDA

    4. K- เพื่อนบ้านที่ ใกล้ที่สุด

    อัลกอริทึม kNN เป็นหนึ่งในขั้นตอนวิธีการเรียนรู้ของเครื่องที่ดีสำหรับผู้เริ่มต้น พวกเขาคาดการณ์ตามข้อมูลที่มีอยู่เดิม เพื่อ จัดประเภทข้อมูลเป็นหมวดหมู่ ตามลักษณะที่แตกต่างกัน

    อยู่ใน รายการอัลกอริธึมการเรียนรู้ของเครื่องภายใต้ การ ดูแล ซึ่งส่วนใหญ่ใช้สำหรับการจัดหมวดหมู่ มันจัดเก็บข้อมูลที่มีอยู่และใช้เพื่อวัดความคล้ายคลึงกันในกรณีใหม่

    K ใน kNN เป็นพารามิเตอร์ที่หมายถึงจำนวนของเพื่อนบ้านที่ใกล้ที่สุดที่จะถูกรวมอยู่ใน“ส่วนใหญ่การออกเสียงลงคะแนน” ที่ ด้วยวิธีนี้เพื่อนบ้านของแต่ละองค์ประกอบ "โหวต" เพื่อกำหนดระดับของเขา

    วิธีที่ดีที่สุดวิธีหนึ่งในการใช้อัลกอริธึม kNN คือเมื่อคุณมีชุดข้อมูลขนาดเล็กที่ปราศจากสัญญาณรบกวนและข้อมูลทั้งหมดในป้ายกำกับ อัลกอริทึมนี้ไม่รวดเร็วและไม่สอนให้รู้จักข้อมูลที่ไม่สะอาด เมื่อชุดข้อมูลมีขนาดใหญ่ขึ้น ไม่ควรใช้ kNN

    อัลกอริธึม kNN ทำงานดังนี้: ขั้นแรก พารามิเตอร์ K ถูกระบุ หลังจากนั้นอัลกอริธึมจะสร้างรายการของรายการ ซึ่งอยู่ใกล้กับตัวอย่างข้อมูลใหม่ จากนั้นจะค้นหาการจำแนกประเภทที่พบบ่อยที่สุดของรายการ และสุดท้ายจะจัดประเภทให้กับอินพุตข้อมูลใหม่

    ในแง่ของแอปพลิเคชันในชีวิตจริง เครื่องมือค้นหาใช้อัลกอริทึม kNN เพื่อกำหนดว่าผลการค้นหาเกี่ยวข้องกับข้อความค้นหาหรือไม่ พวกเขาเป็นฮีโร่ที่ไม่ได้ร้องซึ่งช่วยประหยัดเวลาผู้ใช้เมื่อทำการค้นหา

    ถัดมาต้นไม้ Trio: ถดถอยต้นไม้, สุ่มป่าและ AdaBoost

    ไปเลย:

    5. ต้นไม้ถดถอย (aka Decision Trees)

    ใช่ พวกมันถูกเรียกว่า ต้นไม้ แต่เนื่องจากเรากำลังพูดถึงอัลกอริธึมการเรียนรู้ของเครื่อง ลองนึกภาพพวกมันด้วยรากที่ด้านบน กิ่ง และใบที่ด้านล่าง

    ต้นไม้การถดถอย เป็นประเภทของ อัลกอริทึมการเรียนรู้ ภายใต้ การ ดูแล ซึ่งน่าประหลาดใจ ทำงานได้ดีใน Python (อัลกอริทึม ML ส่วนใหญ่ทำอย่างนั้น)

    เหล่านี้“ต้นไม้” จะเรียกว่าต้นไม้ตัดสินใจและมีการใช้สำหรับการสร้างแบบจำลองการคาดการณ์ พวกเขาต้องการความพยายามเพียงเล็กน้อยจากผู้ใช้ในแง่ของปริมาณข้อมูลที่ป้อนเข้า

    การแสดงตนเป็นต้นไม้ไบนารีและแก้ปัญหาการจำแนกประเภท ตามชื่อที่แนะนำ อัลกอริทึมประเภทนี้ใช้แบบจำลองการตัดสินใจแบบต้นไม้ พวกเขาทำการคัดกรองตัวแปรหรือการเลือกคุณสมบัติ ข้อมูลที่ป้อนเข้าสามารถเป็นได้ทั้งตัวเลขและหมวดหมู่

    แปลได้โปรด!

    แน่นอน. ทุกครั้งที่คุณตัดสินใจ คุณจะเปลี่ยนไปใช้สถานการณ์ใหม่ - ด้วยการตัดสินใจครั้งใหม่ แต่ละเส้นทางที่เป็นไปได้ที่คุณสามารถทำได้คือ "สาขา" ในขณะที่การตัดสินใจคือ "โหนด" จุดเริ่มต้นเริ่มต้นของคุณคือโหนดหลัก

    นั่นเป็นวิธีที่อัลกอริธึมทรีการตัดสินใจสร้างชุดของโหนดและใบไม้ สิ่งสำคัญที่นี่คือทั้งหมดมาจากโหนดเดียว (ในทางตรงกันข้าม อัลกอริธึมของ ฟอเรสต์แบบสุ่ม สร้างต้นไม้จำนวนหนึ่ง แต่ละโหนดมีโหนดหลัก)

    ในแง่ของการใช้งานจริง ต้นไม้การถดถอยสามารถใช้ทำนายอัตราการรอดตาย เบี้ยประกัน และราคาอสังหาริมทรัพย์ ขึ้นอยู่กับปัจจัยต่างๆ

    ต้นไม้ถดถอย "เติบโต" กิ่งก้านของการตัดสินใจจนกว่าจะถึงเกณฑ์การหยุด มันทำงานได้ดีขึ้นกับข้อมูลอินพุตจำนวนเล็กน้อย เพราะไม่เช่นนั้น คุณอาจได้รับชุดข้อมูลเอาต์พุตแบบเอนเอียง

    อัลกอริธึมจะตัดสินใจว่าจะแยกส่วนใดและสร้างสาขาใหม่จากการตัดสินใจ โดยอิงตามอัลกอริธึมหลาย ๆ ตัว ข้อมูลจะถูกแบ่งออกเป็นส่วนต่างๆ ของบันทึกย่อย่อย ซึ่งรวบรวมจากตัวแปรที่มีอยู่ทั้งหมด

    6. ป่าสุ่ม

    อัลกอริทึมป่าสุ่มเป็นรูปแบบของการเรียนรู้เครื่องภายใต้การดูแลอีก มันสร้างแผนภูมิการตัดสินใจหลายแบบ แทนที่จะเป็นต้นไม้เดียวเหมือนต้นไม้การถดถอย โหนดถูกกระจายแบบสุ่มและลำดับของโหนดไม่มีนัยสำคัญต่อข้อมูลเอาต์พุต ยิ่งจำนวนต้นไม้มากเท่าไร ผลลัพธ์ก็จะยิ่งแม่นยำมากขึ้นเท่านั้น

    อัลกอริทึมประเภทนี้สามารถใช้ได้ทั้งการจำแนกประเภทและการถดถอย หนึ่งในคุณสมบัติที่น่ากลัวของอัลกอริทึมป่าสุ่มคือว่ามันสามารถทำงานได้เมื่อเป็นสัดส่วนใหญ่ของข้อมูลจะหายไป นอกจากนี้ยังมีพลังในการทำงานกับชุดข้อมูลขนาดใหญ่

    ในกรณีของการถดถอย อัลกอริธึมเหล่านี้ไม่ใช่ทางเลือกที่ดีที่สุด เพราะมันไม่สามารถควบคุมสิ่งที่โมเดลทำได้มากนัก

    อัลกอริธึม Random Forest มีประโยชน์มากในอีคอมเมิร์ซ หากคุณต้องการตรวจสอบว่าลูกค้าของคุณจะชอบรองเท้าคู่ใดหรือไม่ คุณจะต้องรวบรวมข้อมูลเกี่ยวกับการซื้อก่อนหน้านี้เท่านั้น

    คุณระบุประเภทของรองเท้า ไม่ว่าพวกเขาจะมีส้นรองเท้าหรือไม่ก็ตาม เพศของผู้ซื้อ และช่วงราคาของคู่ก่อนหน้าที่พวกเขาสั่งซื้อ นี่จะเป็นข้อมูลที่ป้อนของคุณ

    อัลกอริทึมจะสร้างต้นไม้มากพอที่จะให้ค่าประมาณที่แม่นยำแก่คุณ

    ยินดี!

    และนี่คืออัลกอริธึมระบบต้นไม้สุดท้าย:

    7. AdaBoost

    AdaBoost ย่อมาจาก Adaptive Boosting อัลกอริทึมได้รับรางวัล Godel Prize ในปี 2546 สำหรับผู้สร้าง

    เช่นเดียวกับสองก่อนหน้านี้ อันนี้ใช้ระบบต้นไม้ด้วย เพียงแทนหลายโหนดและใบไม้ต้นไม้ใน AdaBoost ผลิตเพียง 1 โหนดและ 2 ใบอาคาตอ

    อัลกอริทึม AdaBoost แตกต่างอย่างมากจากต้นไม้ตัดสินใจและป่าสุ่ม

    มาดูกัน:

    ขั้นตอนวิธีต้นไม้ตัดสินใจจะใช้ตัวแปรจำนวนมากก่อนที่จะผลิตออก ตอสามารถใช้ 1 ตัวแปรในการตัดสินใจ

    ในกรณีของ อัลกอริธึม ฟอเรสต์แบบสุ่ม ต้นไม้ ทั้งหมดมี ความสำคัญเท่าเทียมกัน สำหรับการตัดสินใจขั้นสุดท้าย อัลกอริธึม AdaBoost กำหนดลำดับความสำคัญให้กับตอไม้บางอย่างเหนือสิ่งอื่นใด

    และสุดท้าย แต่ไม่น้อยป่าสุ่มวุ่นวายมากขึ้นเพื่อที่จะพูด หมายความว่าลำดับของต้นไม้ไม่เกี่ยวข้อง ผลลัพธ์ไม่ได้ขึ้นอยู่กับลำดับการผลิตของต้นไม้ ในทางตรงกันข้าม สำหรับอัลกอริธึม AdaBoost ลำดับเป็นสิ่งสำคัญ

    ผลของต้นไม้ทุกต้นเป็นพื้นฐานสำหรับต้นต่อไป ดังนั้นหากมีข้อผิดพลาดระหว่างทาง ต้นไม้ทุกต้นที่ตามมาจะได้รับผลกระทบ

    เอาล่ะ อัลกอริทึมนี้สามารถทำอะไรในชีวิตจริงได้บ้าง

    อัลกอริธึม AdaBoost โดดเด่นในด้านการดูแลสุขภาพ ซึ่งนักวิจัยใช้อัลกอริทึมเหล่านี้ในการวัดความเสี่ยงของโรค คุณมีข้อมูล แต่ปัจจัยต่าง ๆ มีความโน้มถ่วงต่างกัน (ลองนึกภาพคุณล้มทับแขนและแพทย์ใช้อัลกอริทึมในการพิจารณาว่าแขนหักหรือไม่ หากข้อมูลที่ป้อนมีทั้งภาพเอ็กซ์เรย์ที่แขนและรูปถ่ายเล็บที่หักของคุณ… ก็ค่อนข้างชัดเจนว่าตอไม้ไหน จะให้ความสำคัญมากขึ้น)

    ตอนนี้เราออกจากป่าแล้ว มาดูอัลกอริธึมการเรียนรู้ของเครื่องอีก 3 ประเภท:

    8. อ่าวไร้เดียงสา

    สิ่งนี้มีประโยชน์เมื่อคุณมี ปัญหาการ จัดประเภทข้อความ เป็นอัลกอริธึมการเรียนรู้ของเครื่องที่ใช้เมื่อต้องจัดการกับชุดข้อมูลที่มีมิติสูง เช่น การกรองสแปมหรือการจัดประเภทบทความข่าว

    อัลกอริทึมมีชื่อลายเซ็นนี้เนื่องจากถือว่าแต่ละตัวแปรเป็นอิสระ กล่าวอีกนัยหนึ่ง จะถือว่าคุณลักษณะต่างๆ ของข้อมูลที่ป้อนเข้านั้นไม่เกี่ยวข้องกันโดยสิ้นเชิง ทำให้เป็นตัวแยกประเภทความน่าจะเป็นที่ง่ายและมีประสิทธิภาพ

    ส่วน "Bayes" ของชื่อหมายถึงชายผู้คิดค้นทฤษฎีบทที่ใช้สำหรับอัลกอริทึม กล่าวคือ – Thomas Bayes ทฤษฎีบทของเขา อย่างที่คุณอาจสงสัย จะตรวจสอบความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์

    ความน่าจะเป็นคำนวณในสองระดับ อันดับแรก ความน่าจะเป็นของแต่ละชั้น ประการที่สอง ความน่าจะเป็นแบบมีเงื่อนไขตามปัจจัยที่กำหนด

    9. การเรียนรู้การหาปริมาณเวกเตอร์

    การเรียนรู้ขั้นตอนวิธีเวกเตอร์หรือ LVQ เป็นหนึ่งในขั้นตอนวิธีการเรียนรู้ของเครื่องที่สูงขึ้น

    ซึ่งแตกต่างจาก kNN อัลกอริทึม LVQ หมายถึงขั้นตอนวิธีเครือข่ายประสาทเทียม กล่าวอีกนัยหนึ่ง มีจุดมุ่งหมายเพื่อสร้างระบบประสาทของสมองมนุษย์ขึ้นใหม่

    อัลกอริธึม LVQ ใช้คอลเลกชั่นของเวกเตอร์สมุดรหัสเป็นตัวแทน โดยพื้นฐานแล้วจะเป็นรายการของตัวเลข ซึ่งมีคุณสมบัติอินพุตและเอาต์พุตเหมือนกันกับข้อมูลการฝึกของคุณ

    10. รองรับ Vector Machines

    เหล่านี้เป็นหนึ่งในที่สุดขั้นตอนวิธีการเรียนรู้ของเครื่องที่เป็นที่นิยม

    อัลกอริทึมการสนับสนุนเวกเตอร์เครื่องเหมาะสำหรับกรณีที่รุนแรงของการจำแนกประเภท ความหมาย – เมื่อขอบเขตการตัดสินใจของข้อมูลที่ป้อนไม่ชัดเจน SVM ทำหน้าที่เป็นเขตแดนที่แยกคลาสอินพุตได้ดีที่สุด

    SVM สามารถใช้ในชุดข้อมูลหลายมิติ อัลกอริธึมแปลงสเปซที่ไม่เป็นเชิงเส้นเป็นสเปซเชิงเส้น ใน 2 มิติ คุณสามารถเห็นภาพตัวแปรเป็นเส้นตรง และทำให้ระบุความสัมพันธ์ได้ง่ายขึ้น

    มีการใช้ SVM ในหลากหลายสาขาในชีวิตจริงแล้ว:

    • ในงานภาพทางการแพทย์และการจำแนกทางการแพทย์
    • เพื่อศึกษาคุณภาพอากาศในพื้นที่ที่มีประชากรมาก
    • เพื่อช่วยในการวิเคราะห์ทางการเงิน
    • ในอัลกอริธึมการจัดอันดับหน้าสำหรับเครื่องมือค้นหา
    • สำหรับการจดจำข้อความและวัตถุ

    ดูเหมือนว่ามีดสวิสของอัลกอริธึม ML ใช่ไหม

    สรุป

    มนุษย์และคอมพิวเตอร์สามารถทำงานร่วมกันได้สำเร็จ

    นักวิจัยรับรองกับเราว่าการเป็นหุ้นส่วนนี้ สามารถ และ จะ ให้ผลลัพธ์ที่น่าอัศจรรย์ อัลกอริธึมแมชชีนเลิร์นนิงช่วยมนุษยชาติได้หลายวิธีแล้ว

    หน้าที่ที่สำคัญที่สุดอย่างหนึ่งของการเรียนรู้ด้วยเครื่องและ อัลกอริธึม AI คือการจำแนกประเภท

    มาดูอัลกอริธึมการเรียนรู้ของเครื่อง 10 อันดับแรกอีกครั้งโดยสรุป:

    • การถดถอยเชิงเส้น - ใช้ในการสร้างความสัมพันธ์ระหว่าง 2 ตัวแปร - Logistic Regression – ตัวแยกประเภททวินาม มีเพียง 2 ผลลัพธ์ที่เป็นไปได้ของแต่ละแบบสอบถาม
    • การวิเคราะห์การเลือกปฏิบัติเชิงเส้น – ทำงานได้ดีที่สุดสำหรับการจำแนกข้อมูลตามหมวดหมู่ที่รู้จัก
    • K-Nearest Neighbor – จำแนกข้อมูลออกเป็นหมวดหมู่
    • ต้นไม้ถดถอย – ใช้สำหรับการสร้างแบบจำลองการทำนาย
    • Random Forest – ใช้กับชุดข้อมูลขนาดใหญ่ และเมื่อข้อมูลอินพุตส่วนใหญ่หายไป
    • AdaBoost – การจำแนกประเภทไบนารี
    • Naive Bayes – การสร้างแบบจำลองการคาดการณ์
    • Learning Vector Quantization – อัลกอริธึมโครงข่ายประสาทเทียม
    • รองรับ Vector Machines – กรณีการจัดประเภทที่รุนแรงในชุดข้อมูลหลายมิติ

    อัลกอริธึมทั้งหมดเหล่านี้ (รวมถึงอัลกอริธึมใหม่ที่ยังมาไม่ถึง) จะวางรากฐานสำหรับยุคใหม่แห่งความเจริญรุ่งเรืองสำหรับมนุษยชาติ มันจะทำให้เป็นไปได้ (และจำเป็น) รายได้พื้นฐานสากล เพื่อให้แน่ใจว่าคนที่มีความสามารถน้อยกว่าจะอยู่รอด (ใครจะไปก่อกบฏและทำให้สังคมของเราวุ่นวาย เออ..)

    ใครจะคิดว่าบทความเกี่ยวกับ อัลกอริธึมการเรียนรู้ของเครื่อง จะดูไร้ สาระ นั่นคือสำหรับวันนี้

    แล้วเจอกันนะพวก!

    คำถามที่พบบ่อย

    ข้อจำกัดของแมชชีนเลิร์นนิง

    แมชชีนเลิร์นนิงนั้นยอดเยี่ยมและให้ความกระจ่างเกี่ยวกับอนาคตของเทคโนโลยี ที่มากับค่าใช้จ่ายบางอย่าง ตัวอย่างเช่น คอมพิวเตอร์ที่โฮสต์โปรแกรมแมชชีนเลิร์นนิงใช้ไฟฟ้าและทรัพยากรในปริมาณมาก ข้อบกพร่องอีกประการหนึ่งของแมชชีนเลิร์นนิงจนถึงขณะนี้คือการแก้ความกำกวมเอนทิตีเป็นครั้งคราว บางครั้งเครื่องจักรก็แยกไม่ออกระหว่างชื่อแอนน์ แฮททาเวย์ กับมูลค่าหุ้นของเบิร์กเชียร์ แฮททาเวย์ ทุกครั้งที่นักแสดงได้รับความสนใจจากสื่อ บริษัทก็จะได้เงิน...

    อัลกอริธึมการเรียนรู้ของเครื่องคืออะไร?

    การเรียนรู้ของเครื่องเป็นวิธีการคำนวณ แม้ว่าอัลกอริธึม "ดั้งเดิม" จะต้องการโปรแกรมเมอร์ในการเขียน แต่อัลกอริทึมของแมชชีนเลิร์นนิงนั้นฝึกฝนตนเองเป็นหลัก ใช่ ไม่ล้อเล่น!

    อัลกอริธึมการเรียนรู้ของเครื่องที่ดีที่สุดคืออะไร?

    ขึ้นอยู่กับงานที่คุณต้องทำ การเลือกอัลกอริธึมที่ดีที่สุดสำหรับงานในมือนั้นขึ้นอยู่กับขนาด คุณภาพ และความหลากหลายของอินพุตของคุณ ตลอดจนชนิดของข้อมูลเอาท์พุตที่ผู้ใช้ร้องขอ

    คุณจะเขียนอัลกอริธึมการเรียนรู้ของเครื่องอย่างไร?

    เช่นเดียวกับสิ่งอื่น ๆ กระบวนการเริ่มต้นด้วยการทำความรู้จักพื้นฐานของอัลกอริทึมที่คุณเลือกสำหรับปัญหาของคุณ คุณจะต้องปรึกษาแหล่งเรียนรู้ต่างๆ และเลือกแหล่งการเรียนรู้ที่เหมาะกับคุณที่สุด จากนั้นเริ่มต้นด้วยการแบ่งอัลกอริทึมออกเป็นหน่วยเล็กๆ เริ่มต้นด้วยตัวอย่างง่ายๆ และเมื่อคุณเข้าใจในสิ่งต่างๆ ได้ คุณจะตรวจสอบด้วยการใช้งานที่เชื่อถือได้ แล้วคุณทำกระบวนการทั้งหมดให้เสร็จสิ้น มันอาจจะฟังดูยากกว่าที่เป็นอยู่ แต่ก็คุ้มค่าที่จะลอง!