ระบบแอมะซอนเว็บเซอร์วิส (AWS) ล่ม เรารู้อะไรแล้วบ้าง

ที่มาของภาพ, Getty Images
เมื่อเวลาประมาณ 15.00 น. วันนี้ (20 ต.ค.) ตามเวลาประเทศไทย ระบบแอมะซอนเว็บเซอร์วิส (Amazon Web Service - AWS) ขัดข้อง ทำให้หลายเว็บไซต์และแอปพลิเคชันทั่วโลกได้รับผลกระทบ
แอปพลิเคชันยักษ์ใหญ่ระดับโลกหลายตัว เช่น แคนวา (Canva), สแนปแชท (Snapchat), ดูโอลิงโก (Duolingo) และซูม (Zoom) ไม่สามารถใช้งานได้
นอกจากนี้ มีรายงานด้วยว่าธนาคารหลายแห่งในต่างประเทศก็ได้รับผลกระทบจากเหตุขัดข้องนี้เช่นกัน เช่น ธนาคาร Halifax, Lloyds และ Bank of Scotland ในสหราชอาณาจักร
AWS ซึ่งเป็นบริการคลาวด์ของบริษัทแอมะซอน (Amazon) บริษัทเทคยักษ์ใหญ่ของสหรัฐฯ แอมะซอนระบุบนเว็บไซต์ว่า มีการพบอัตราข้อผิดพลาดที่สำคัญในภูมิภาค US-EAST-1 ส่งผลให้บริการ AWS ในภูมิภาคได้รับผลกระทบ
ต่อมา บริษัทระบุสาเหตุเบื้องต้นของการขัดข้องของระบบได้แล้ว โดยพบว่าปัญหานี้เกี่ยวข้องกับการแก้ไข DNS ของปลายทาง DynamoDB API ใน US-EAST-1 อย่างไรก็ตาม ลูกค้าอาจเผชิญกับความล่าช้าของระบบหรืออาจเข้าไม่ถึงบางบริการในขณะนี้ โดยทางบริษัทกำลังเร่งแก้ไขปัญหาดังกล่าว
ต่อมา เว็บไซต์ของ AWS ระบุว่า ปัญหาที่เกิดขึ้นได้รับการแก้ไขแล้ว "และบริการส่วนใหญ่น่าจะทำงานได้อย่างถูกต้องแล้ว แต่อาจยังคงมีปัญหาอยู่บ้างเมื่อระบบกำลังเร่งให้ทุกอย่างกลับมาดำเนินได้อย่างปกติโดยเร็ว"
แอมะซอนเว็บเซอร์วิส (Amazon Web Services - AWS) คืออะไร ?
AWS คือบริการคลาวด์คอมพิวติ้งของบริษัทแอมะซอน โดย AWS เป็นรากฐานของเว็บไซต์และแพลตฟอร์มของบริษัทขนาดใหญ่หลายล้านแห่ง รวมถึงแอปพลิเคชันจำนวนมากบนสมาร์ทโฟนของคุณก็ทำงานอยู่บนศูนย์ข้อมูลของ AWS
ในหน้าการอัปเดตสถานะบริการของ AWS ที่ระบุถึงปัญหาต่าง ๆ ในระบบ ระบุว่าบริษัทสามารถยืนยัน "อัตราข้อผิดพลาดที่สำคัญสำหรับคำขอ" ไปยังจุดปลายทางหนึ่งสำหรับบริการต่าง ๆ ในภูมิภาค US-EAST-1 และทราบถึงสาเหตุของการขัดข้องครั้งนี้แล้ว และกำลังเร่งแก้ไขปัญหา
โดยขณะนี้ บางปัญหาได้รับการแก้ไข้เรียบร้อยแล้ว แต่ผู้ใช้บางส่วนอาจยังประสบปัญหาอยู่
เว็บไซต์ แอปฯ และบริการใดบ้างที่ได้รับผลกระทบ ?
ผู้ใช้งานหลายแพลตฟอร์มและเว็บไซต์รายงานปัญหาการใช้งานที่เพิ่มสูงขึ้น ตามรายงานของ Downdetector ซึ่งเป็นเครื่องมือตรวจสอบการหยุดทำงานของแพลตฟอร์มต่าง ๆ บนอินเทอร์เน็ต
ปัจจุบันมีผู้ใช้งานสแนปแชท (Snapchat) แจ้งปัญหาไปแล้วกว่า 5,000 รายการ
แพลตฟอร์มอื่น ๆ ที่ได้รับผลกระทบ เช่น โรบล็อกซ์ (Roblox), ซิกแนล (Signal), ไลฟ์ 360 (Life 360), แคนวา (Canva), ฟอร์ทไนท์ (Fortnite) และ สแลค (Slack)
นอกจากนี้ ลูกค้าของหลายธนาคารในต่างประเทศยังรายงานปัญหาการใช้งานด้วย
โดยมีลูกค้าของธนาคาร Lloyds และบริษัทในเครืออย่าง Halifax และ Bank of Scotland ร้องเรียนว่าพวกเขาไม่สามารถเข้าสู่ระบบบนแอปฯ ของธนาคารได้ และบัตรเครดิตของบางรายก็ไม่ได้รับการอนุมัติในการจ่ายซื้อสินค้า แต่บีบีซียังไม่สามารถตรวจสอบเรื่องร้องเรียนดังกล่าวอย่างเป็นอิสระได้
เนื่องจากว่า AWS ขับเคลื่อนโครงสร้างพื้นฐานเบื้องหลังเว็บไซต์ต่าง ๆ มากมาย ผลกระทบที่เกิดขึ้นจากปัญหาระบบล่มจึงกว้างขวางมาก
ปัญหาอินเทอร์เน็ตขัดข้องเป็นวงกว้างกำลังเพิ่มมากขึ้นหรือไม่ ?
ในช่วงห้าปีที่ผ่านมา เกิดเหตุขัดข้องของบริการอินเทอร์เน็ตที่ส่งผลกระทบวงกว้างหลายครั้ง ซึ่งปัญหาที่เกิดขึ้นกับบริษัทใดบริษัทหนึ่งแต่ส่งผลกระทบอย่างใหญ่หลวง
แต่ส่วนใหญ่แล้ว ปัญหาเหล่านี้มักได้รับการแก้ไขภายในเวลาไม่กี่ชั่วโมง เนื่องจากวิศวกรต้องเร่งแก้ไขข้อผิดพลาดหรือแก้ไขปัญหาอย่างเร่งด่วน
ผู้เชี่ยวชาญชี้มานานแล้วว่า การพึ่งพาบริษัทอินเทอร์เน็ตยักษ์ใหญ่เพียงไม่กี่รายเพิ่มขึ้นเป็นปัจจัยสำคัญ เและเมื่อบริษัทใหญ่แห่งหนึ่งเกิดข้อผิดพลาด การดำเนินชีวิตและธุรกิจสมัยใหม่ส่วนใหญ่ก็จะหยุดชะงัก
บีบีซีรวบรวมตัวอย่างล่าสุดของเหตุขัดข้องครั้งใหญ่และสาเหตุของปัญหา ดังนี้
- ก.ค. 2024: เกิดเหตุมีโค้ดน่าสงสัยในซอฟต์แวร์รักษาความปลอดภัยทางไซเบอร์ของคราวด์สไตรค์ (CrowdStrike) ถูกติดตั้งโดยอัตโนมัติในระบบคอมพิวเตอร์ ทำให้ระบบหยุดทำงานและแสดงข้อความแสดงข้อผิดพลาด "หน้าจอสีน้ำเงินแห่งความตาย" คอมพิวเตอร์ประมาณ 8.5 ล้านเครื่องใช้งานไม่ได้ชั่วคราว ทำให้บริการอินเทอร์เน็ตจำนวนมากใช้การไม่ได้
- ต.ค. 2021: "ข้อผิดพลาดในการกำหนดค่าไม่ถูกต้อง" ทำให้เฟซบุ๊ก (Facebook), อินสตาแกรม (Instagram) และ วอตส์แอป (WhatsApp) ล่มเป็นเวลาเกือบหกชั่วโมง เว็บไซต์อื่น ๆ รวมถึงเอ็กซ์ (X) ก็ประสบปัญหานี้เช่นกัน เนื่องจากยอดเข้าชมแอปฯ เพิ่มขึ้นอย่างรวดเร็ว
- มิ.ย. 2021: แอมะซอน (Amazon), เรดดิท (Reddit), ทวิตช์ (Twitch), กิตฮับ (GitHub), ชอปปิฟาย (Shopify), สปอติฟาย (Spotify) และเว็บไซต์ข่าวหลายแห่งหยุดให้บริการนานประมาณหนึ่งชั่วโมง หลังจากลูกค้ารายหนึ่งของ ฟาสต์ลี (Fastly) ผู้ให้บริการคลาวด์คอมพิวติ้ง บังเอิญทำให้เกิดความพบพร่องที่ไม่เคยมีใครรู้จักมาก่อน ซึ่งเป็นสาเหตุของเหตุการณ์นี้
- ธ.ค. 2020: จีเมล (Gmail), ยูทิวป์ (YouTube), กูเกิลไดร์ฟ (Google Drive) และบริการอื่น ๆ ของ กูเกิล (Google) หยุดให้บริการพร้อมกันประมาณ 90 นาที หลังจากที่บริษัทแจ้งว่าพบ "ปัญหาพื้นที่เก็บข้อมูลภายในเต็มโควต้า"










