AI ปฏิวัติชีวิตประจำวันของเราไปแล้วหรือยัง
AI เป็นประเด็นร้อนที่ได้ปฏิวัติชีวิตประจำวันของเราไปแล้วและจะยังคงเปลี่ยนแปลงอย่างมีนัยสำคัญต่อไป จู่ๆ หลายคนก็เป็นผู้เชี่ยวชาญด้าน AI หลายคนเรียกร้องให้มีการควบคุม AI หลายๆ คนมองว่า AI เป็นเรื่องเล็กๆ น้อยๆ และบอกว่าโมเดลภาษา AI ไม่ได้ประมวลผลข้อมูลส่วนบุคคล ต่อไปนี้เป็นโครงร่างที่มีจุดมุ่งหมายเพื่อชี้แจงความเข้าใจผิด
การแนะนำ
AI นั้นถูกประเมินต่ำเกินไปและประเมินเกินจริง คนส่วนใหญ่ รวมทั้งฉันด้วย ไม่เข้าใจถึงความเป็นไปได้ที่ระบบ AI นำเสนอ เมื่อวานฉันเห็นแนวทางการปฏิวัติ AI ที่ไม่เคยมีใครรู้จักเมื่อสองสัปดาห์ก่อน ในฐานะคนที่ทำงานด้านปัญญาประดิษฐ์อย่างเข้มข้น ฉันรู้สึกแบบนี้เกือบทุกวัน
หลายๆ คนคิดว่า AI กลายเป็นกระแสที่กำลังจะหายไปในไม่ช้า ไม่ถูกต้อง! ด้วยแนวทาง Transformer ฟังก์ชันสติปัญญาของมนุษย์ถูกถอดรหัสในปี 2560 ฉันพูด แทนที่จะเขียน
โปรแกรมอัลกอริธึมเพื่อแก้ปัญหา ฉันแค่ต้องป้อนตัวอย่างที่เพียงพอให้กับระบบ AI ของฉันที่ทำงานอยู่ใต้โต๊ะ แม้แต่อักษรอียิปต์โบราณที่ไม่รู้จักมาก่อนก็ถูกค้นพบและถอดรหัส
เนื่องจากความกลัวอย่างสมเหตุสมผลต่อผลเสียของระบบ AI ที่ทรงพลังมากขึ้น หลายคนจึงเรียกร้องให้มีการควบคุม แต่คุณไม่บอกว่ายังไง
มีผู้สนใจเรื่องเล็กๆ น้อยๆ ที่ต้องการสร้างชื่อเสียงให้กับตนเองในฐานะผู้เชี่ยวชาญด้าน AI หรือผู้ส่งเสริมด้านกฎหมาย พวกเขาบอกผู้อื่นว่าพวกเขาสามารถใช้ ChatGPT อย่างมีกำไรได้อย่างไรหรืออย่างไร แม้แต่ในการประชุม DSRI (German Foundation for Law and Informatics) บทความอ้างว่าแบบจำลอง AI จะไม่ประมวลผลข้อมูลส่วนบุคคล
คนอื่นๆ สร้างความมั่นใจโดยอ้างถึงข้อตกลงการคุ้มครองข้อมูลที่ไม่เป็นทางการฉบับใหม่ระหว่างยุโรปและสหรัฐอเมริกา เพียงเพราะว่าขณะนี้ข้อมูลสามารถส่งไปยังสหรัฐอเมริกาได้โดยไม่ต้องมีการรับประกันเพิ่มเติม บางคนจึงแนะนำว่าการประมวลผลข้อมูลใดๆ ก็ตามจึงได้รับอนุญาต
รายละเอียดเล็กๆ น้อยๆ จะตามมาในแต่ละประเด็น
ความเป็นไปได้ของระบบ AI
AI สามารถทำทุกอย่างที่มนุษย์สามารถทำได้และอีกมากมาย อาจจะยังไม่ใช่ แต่อาจเป็นไปได้ (ในพื้นที่แอปพลิเคชันเฉพาะ X) ในสัปดาห์หน้า ในไม่ช้า หุ่นยนต์ที่มีสมอง AI จะเดินไปรอบๆ และสัมผัสประสบการณ์ด้านสิ่งแวดล้อม นี่จะเหมือนกับวิธีการเรียนรู้ของเด็กๆ ทุกประการ มาดูกันว่าใครจะมาแทนที่พ่อแม่ สิ่งเหล่านี้อาจเป็นผู้ฝึกสอนของมนุษย์ แต่ยังรวมถึงหุ่นยนต์หรืออัลกอริธึมอื่นๆ ด้วย
ตัวอย่างของการพัฒนาอย่างรวดเร็ว: โมเดลภาษา AI สามารถประมวลผลข้อความได้ครั้งละน้อยมากเท่านั้น ข้อความจำนวนนี้เรียกว่าความยาวบริบท เมื่อไม่กี่เดือนที่ผ่านมา ความยาวบริบทในโมเดลภาษา AI เกือบทั้งหมดที่ฉันรู้จักคือ 1,024 อักขระ หรือหนึ่งกิโลไบต์
ความยาวบริบทเพิ่มขึ้นทุกสัปดาห์ ครั้งแรกเป็น 2048 จากนั้นเป็น 4096 จากนั้นเป็น 8192 จากนั้นเป็น 16,000 อักขระ และต่อมาเป็น 32,000 อักขระ เมื่อเร็วๆ นี้ ChatGPT มีความยาวบริบทถึง 128,000 อักขระ
เมื่อวานนี้ฉันอ่านเกี่ยวกับวิธีการที่เป็นที่รู้จักในการวิจัยมาสองสามเดือนแล้ว ซึ่งหมายความว่าสามารถประมวลผลความยาวบริบทหนึ่งพันล้านอักขระ (= 1,000,000,000) ได้ในคราวเดียว คำนวณอย่างรวดเร็ว: ก่อน = 128,000 ตัวอักษร พริบตาต่อมา = 1,000,000,000 ตัวอักษร นั่นเป็นการปรับปรุงถึง 7800 เท่า แบบนั้น
กฎของมัวร์ใช้ไม่ได้กับปัญญาประดิษฐ์
แทนที่จะเพิ่มประสิทธิภาพหรือปัจจัยอื่นๆ อย่างต่อเนื่องทุกๆ 12 ถึง 24 เดือน การปรับปรุงคุณสมบัติ AI ที่เกี่ยวข้องอย่างมีนัยสำคัญจะเกิดขึ้นเกือบทุกเดือน
อีกตัวอย่างหนึ่ง: วิธี Transformer ที่กล่าวถึงข้างต้นมีจุดอ่อนบางประการ เขาหิวทรัพยากรมาก แม้แต่คอมพิวเตอร์หรือกราฟิกการ์ดประสิทธิภาพสูงก็ต้องใช้เวลาสองสามวินาทีในการสร้างคำตอบสำหรับคำถามสำหรับแชทบอต ผู้ใช้ ChatGPT ทุกคนรู้ว่าฉันกำลังพูดถึงอะไร ขณะนี้มีวิธีที่ให้คุณภาพการตอบสนองเท่ากัน แต่ตอบสนองเร็วขึ้น 8 เท่า และต้องใช้หน่วยความจำการ์ดกราฟิกราคาแพงและหายากเพียงหนึ่งในสามในการคำนวณ
หากคุณอายุเกิน 50 ปี ฉันมีข่าวดีสำหรับคุณ มีโอกาสที่คุณจะเสียชีวิตอย่างสงบตามธรรมชาติ ทุกคนที่อายุน้อยกว่ามากจะได้เห็นการสิ้นสุดของมนุษยชาติ เพราะระบบ AI จะเอาชนะ เป็นทาส หรือกวาดล้างเราอย่างมหาศาล บางทีภัยพิบัติอื่นอาจเกิดขึ้นล่วงหน้า แต่นั่นไม่ใช่ประเด็นของโพสต์นี้
AI เป็นแค่สถิติใช่ไหม?
คำถามไม่เกี่ยวข้อง ไม่สำคัญว่าสมองของมนุษย์จะขึ้นอยู่กับกระบวนการทางสถิติหรือไม่ สิ่งที่สำคัญคือสิ่งที่ออกมาในตอนท้าย เห็นได้ชัดว่าการดำรงอยู่ทั้งหมดของเรานั้นขึ้นอยู่กับกระบวนการทางสถิติ เปรียบเทียบสิ่งนี้กับฟิสิกส์ควอนตัม ซึ่งเป็นทฤษฎีพื้นฐานและทรงพลังมาก พื้นฐานของฟิสิกส์ควอนตัมคือพฤติกรรมของอนุภาคเล็กๆ ในการดำรงอยู่ของเราไม่สามารถคาดเดาได้จริงๆ แต่การกล่าวเกี่ยวกับอนุภาคสามารถทำได้ก็ต่อเมื่อพิจารณาหลายรายการและนำค่าเฉลี่ยมาจากการสังเกต
เห็นได้ชัดว่าไวยากรณ์ภาษาเยอรมันขึ้นอยู่กับเราในการเรียนรู้ว่าคำใดที่มักจะร้อยเข้าด้วยกันและเข้ากัน นั่นก็เป็นสถิติด้วย แต่ไม่ค่อยมีใครพูดถึงเรื่องนี้
กฎระเบียบของเอไอ
ความสามารถของ AI สร้างความหวาดกลัวหรือกังวลให้กับผู้คนจำนวนมาก เนื่องจากถูกมองว่าเป็นสิ่งที่ไม่ถูกต้อง บางคนจึงเรียกร้องให้มีการควบคุมระบบ AI ความหมายที่แท้จริงของสิ่งนี้มักไม่ได้ถูกกล่าวไว้ ความต้องการสิ่งเดียวที่ติดอยู่ในหัวของฉันมีดังต่อไปนี้:
การติดฉลากผลงานที่สร้างโดย AI: รูปภาพ วิดีโอ ข้อความ...
การเปิดเผยแหล่งที่มาที่ใช้ในการฝึกระบบ AI
อื่น ๆ อีก? ฉันไม่สามารถคิดอะไรที่ควรค่าแก่การกล่าวถึงได้ในขณะนี้
ประเด็นแรก เช่น: งานที่เกียวข้องกับของขวัญ งานติดฉลาก เป็นความคิดที่ดี โดยแทบไม่ต้องเปลี่ยนแปลงอะไรเลย อาชญากรจะเริ่มติดป้ายวิดีโอปลอมและข่าวปลอมว่าเป็นงานปลอมที่สร้างขึ้นโดยไม่ได้ตั้งใจ คนอื่นๆ ต่างก็ปฏิบัติตามงานการติดฉลาก สิ่งนี้ไม่เพียงแต่จะช่วยมนุษยชาติ แต่สามารถทำได้ เพียงเพราะผลประโยชน์ที่ปรากฎอยู่ แต่จะเป็นการแทรกแซงแบบเลือกสรรที่มีผลกระทบเชิงคุณภาพเพียงเล็กน้อย
การเปิดเผยแหล่งที่มา เช่น ข้อมูลการฝึกอบรม ใครก็ตามที่ต้องการอะไรแบบนี้ก็จะไม่รู้เลยว่าโมเดล AI มีและมีโครงสร้างเป็นอย่างไร ความต้องการนี้มาช้านานหลายปี โดยมีแหล่งที่มาที่ส่วนใหญ่เป็นที่รู้จักกันดี เช่น :
เดอะไพล์ (เนื้อเพลง)
การรวบรวมข้อมูลทั่วไป (ข้อความ)
ชุดข้อมูล LAION (รูปภาพ สโมสรเยอรมัน!)
ข้อมูลข้อความรวมถึงวิกิพีเดีย เว็บไซต์ข่าว และเว็บไซต์ยอดนิยมโดยเฉพาะ
ถ้าฉันบอกคุณว่าโมเดล AI ของฉันอ่านพจนานุกรมเคมีได้ คุณจะทำอย่างไร ตามทฤษฎีแล้ว AI ของฉันสามารถพัฒนาอาวุธได้ ในทางปฏิบัติ สิ่งนี้ได้เกิดขึ้นแล้ว แต่เป็นการทดลองโดยนักวิจัยที่มีอัธยาศัยดีที่สร้างส่วนผสมออกฤทธิ์โดยใช้ AI และจากการทดสอบ เปลี่ยน "หนึ่ง" ให้เป็น "ลบหนึ่ง" อันตรายจึงมีมาก กล่าวโดยสรุป ฉันต้องย่อให้สั้นลง: AI ไม่สามารถควบคุมได้ AI สามารถทำทุกอย่างที่มนุษย์สามารถทำได้ คุณจะควบคุมผู้คนได้อย่างไร? ตราบใดที่พวกเขาไม่ได้ทำอะไรไม่ดีเลย หลังจากเกิดเหตุการณ์เลวร้าย (โจร ฆาตกร ผู้ก่อการร้าย ผู้ก่อกวน ฯลฯ) การดำเนินคดีทางอาญาก็เกิดขึ้น แต่แล้วก็สายเกินไป เท่าที่ฉันรู้ ในระบบประชาธิปไตยไม่เคยเป็นไปได้ และยังไม่สามารถห้ามไม่ให้บุคคลคิดได้ แต่ AI สามารถคิดได้เร็วกว่า นานกว่า และ (ในเร็วๆ นี้) ได้ดีกว่ามนุษย์มาก
อย่างไรก็ตาม ฉันคิดว่าคำถามที่ว่า AI สามารถเป็นผู้เขียนงานได้หรือไม่นั้นส่วนใหญ่ไร้สาระ เพราะถ้าฉันมีภาพที่ AI ของฉันสร้างขึ้นล่วงหน้า (ไม่มีลายน้ำ) แล้วอ้างว่าเป็นงานของฉัน คุณจะไม่สามารถแสดงสิ่งที่ตรงกันข้ามให้ฉันเห็นได้หรือจะทำได้เพียงใช้ความพยายามอย่างมากเท่านั้น . เหนือสิ่งอื่นใด รูปภาพหรือเพลงที่สร้างโดย AI ยังคงสามารถแก้ไขและขยายได้ด้วยตนเอง โมเดลภาษาประมวลผลข้อมูลส่วนบุคคลหรือไม่ ใช่ เกือบทุกครั้ง และทุกครั้งเมื่อ ก) ข้อมูลส่วนบุคคลปรากฏในข้อมูลการฝึกอบรมหรือ ข) ผู้ใช้ใช้ข้อมูลส่วนบุคคลในการป้อนข้อมูล (พร้อมท์) ไปยังแชทบอท จุด ก) เป็นกรณีของโมเดลภาษาทั้งหมดที่ฉันรู้ ดูตัวอย่าง ชุดข้อมูลการฝึกอบรมขนาดใหญ่ The Pile และ C4 (Collosal Cleaned Common Crawl) ซึ่งใช้ในแชทบอทรุ่นทั่วไปทั้งหมด เห็นได้ชัดว่ามีบางคนต้องการให้ระบบ AI ไม่ประมวลผลข้อมูลส่วนบุคคล ความจริงก็คือ: โมเดลภาษา AI ประมวลผลข้อมูลส่วนบุคคลและจัดเก็บข้อมูลดังกล่าวด้วย บางคนยอมรับสิ่งนี้แล้วอ้างว่าข้อมูลส่วนบุคคลสามารถรับรู้และไม่เปิดเผยตัวตนได้โดยอัตโนมัติ นี่เป็นเรื่องไร้สาระ ใครก็ตามที่พูดแบบนี้ไม่รู้อะไรเลยเกี่ยวกับปัญญาประดิษฐ์หรือการปกป้องข้อมูล น่าเสียดายที่มีคนและองค์กรที่ไร้เดียงสาเป็นพิเศษที่ได้รับการเสนอชื่อเข้าชิงรางวัลนวัตกรรมสำหรับโซลูชันที่ถูกกล่าวหาซึ่งให้คำมั่นสัญญาที่ไม่มีมูลเกี่ยวกับการปกปิดข้อมูล Privacy Shield II (กรอบความเป็นส่วนตัวของข้อมูล) อย่างเป็นทางการแล้ว โลกแห่งการปกป้องข้อมูลสำหรับการถ่ายโอนข้อมูลระหว่างสหภาพยุโรปและสหรัฐอเมริกากลับมาแข็งแรงอีกครั้ง ข้อกล่าวหาที่นำไปสู่การพิจารณาคดีของ ECJ Schrems II และ Privacy Shield ที่ไม่ถูกต้องก็คือสหรัฐอเมริกาเป็นรัฐหน่วยสืบราชการลับ (FISA 702, EO12333, Cloud Act) เห็นได้ชัดว่ามีการหารือเรื่องนี้กับ Data Privacy Framework (DPF) และอาจจะถูกยกเลิกโดย ECJ ในไม่ช้า ประเด็นก็คือตอนนี้ข้อมูลส่วนบุคคลสามารถถ่ายโอนจากสหภาพยุโรปไปยังสหรัฐอเมริกาได้อีกครั้งโดยไม่มีการรับประกันพิเศษใด ๆ คนโง่บางคนได้มาจากสิ่งนี้หรือแนะนำว่าการประมวลผลข้อมูลทั้งหมดได้รับอนุญาตในสหรัฐอเมริกาแล้ว ถูกต้องแล้วที่การประมวลผลข้อมูลส่วนบุคคลใดๆ จะต้องดำเนินการตามฐานทางกฎหมายข้อใดข้อหนึ่งในมาตรา 6 (1) GDPR ใช่แล้ว ข้อมูลส่วนบุคคลจะถูกโอนไปยัง ChatGPT เสมอเมื่อใช้อินเทอร์เฟซ ChatGPT ที่อยู่ IP เป็นส่วนตัวและจะถูกส่งอยู่เสมอ น่าเสียดายที่ OpenAI ไม่ชอบที่จะปฏิบัติตามกฎการปกป้องข้อมูล เพราะ AI ของมันเองก็ไม่สามารถปรับปรุงได้ดีนัก แม้แต่ Microsoft ในฐานะผู้ถือหุ้นใน OpenAI ก็ไม่สนใจเรื่องการปกป้องข้อมูลมากนัก ดู Outlook ใหม่ ซึ่งจะใช้ชื่อผู้ใช้และรหัสผ่านของคุณจากบัญชีอีเมลของคุณ และดึงข้อมูลและวิเคราะห์ข้อมูลของคุณและการติดต่อทางอีเมลของคุณ ไม่ต้องพูดถึงปัญหาด้านความปลอดภัยของ Microsoft (Azure) ซึ่ง Microsoft มองข้ามและไม่ได้แก้ไขมาเป็นเวลานาน (อาจจะเป็นตอนนี้?) ผู้เชี่ยวชาญด้านเอไอ บทความ AI ของหลายๆ คนที่ไม่มีความรู้ด้านเทคโนโลยีหรือน้อยมากนั้นน่าทึ่งมาก AI มีพื้นฐานมาจากเทคโนโลยีในระดับหนึ่ง มากกว่าความสำเร็จอื่นๆ เกือบทั้งหมด คนที่ไม่รู้อะไรเลยจริงๆ หรือรู้น้อยมากจะพูดอย่างมีวิจารณญาณได้อย่างไร? แล้วมีสาวก ChatGPT ที่ต้องการสร้างรายได้จากการแนะนำและการปรับปรุงอย่างรวดเร็ว อย่างน้อยพวกเขาก็เข้าใจบางอย่างเกี่ยวกับเทคโนโลยี กล่าวคือ คุณไม่ได้ใช้เมาส์คอมพิวเตอร์เพื่อพูดกับเมาส์ (เช่น Scotty) แต่ใช้เมาส์เพื่อเลื่อนเคอร์เซอร์บนหน้าจอ ใช้เฉพาะกับทุกคนที่ใช้พีซีเป็นครั้งคราวโดยมีจอภาพขนาดใหญ่โดยไม่จำเป็นและแป้นพิมพ์ที่มีประสิทธิภาพโดยไม่จำเป็น แทนที่จะใช้แป้นพิมพ์และหน้าจอสมาร์ทโฟนที่เพียงพอสำหรับคนในช่วงเวลาที่เหมาะสม สาวก ChatGPT เหล่านี้ซึ่งอาจมีความรู้ด้านเทคนิคเพียงเล็กน้อยและรู้วิธีใช้อินเทอร์เน็ต โชคไม่ดีที่บ่อยครั้งหรือเกือบตลอดเวลาไม่มีความคิดหรือความสนใจในการปกป้องข้อมูล ChatGPT เป็นระบบที่ยอดเยี่ยมและสามารถนำไปใช้งานที่ไม่เป็นอันตรายได้ด้วยจิตสำนึกที่ชัดเจน แต่ข้อมูลที่ละเอียดอ่อนล่ะ? ข้อจำกัดของเอไอ ยังคงเป็นกรณีที่โมเดลภาษา (LLM) มักจะทำให้เกิดภาพหลอน เช่น ให้ข้อความที่เป็นเท็จ มันจะคงอยู่อย่างนั้นฉันพูด เครดิต/บทความ: แปลจาก:
Künstliche Intelligenz als Bullshit-Magnet
เคลาส์ เมฟเฟิร์ต (Klaus Meffert)
ปริญญาเอกสาขาวิทยาการคอมพิวเตอร์และทำงานด้านเทคโนโลยีสารสนเทศ
ผู้เชี่ยวชาญด้านไอทีและการปกป้องข้อมูล
กรรมการผู้จัดการของ IT Logic GmbH
ความคิดเห็น
แสดงความคิดเห็น