การเลือกสถาปัตยกรรมการจัดเก็บข้อมูลที่เหมาะสมเป็นหนึ่งในการตัดสินใจด้านโครงสร้างพื้นฐานที่มีผลลัพธ์สำคัญที่สุดที่ทีมไอทีสามารถดำเนินการได้ ไม่ว่าคุณจะกำลังสร้างสภาพแวดล้อมคลาวด์ส่วนตัว บริหารจัดการคลัสเตอร์เวอร์ชวลไลเซชันที่กำลังขยายตัว หรือเพียงแค่พยายามจัดระเบียบข้อมูลที่กระจัดกระจายอย่างไร้ระบบ การเลือกระหว่าง Storage Area Network (SAN), Network Attached Storage (NAS) และ Direct Attached Storage (DAS) จะกำหนดทุกสิ่งทุกอย่าง ตั้งแต่ศักยภาพด้านประสิทธิภาพไปจนถึงความยืดหยุ่นในการปฏิบัติงาน แต่ละรูปแบบมีสมมุติฐานที่แตกต่างกันอย่างชัดเจนเกี่ยวกับวิธีการไหลของข้อมูล วิธีการแบ่งปันทรัพยากร และวิธีการที่สภาพแวดล้อมของคุณจะสามารถปรับขนาดได้ในอนาคต การเข้าใจความแตกต่างเหล่านี้ก่อนตัดสินใจลงทุนซื้อฮาร์ดแวร์และเดินสายเคเบิลนั้นมีประสิทธิภาพด้านต้นทุนมากกว่าการค้นพบความไม่สอดคล้องกันของสถาปัตยกรรมหลังจากดำเนินการติดตั้งแล้ว

บทความนี้อธิบายตรรกะการเลือกอย่างเป็นระบบ โดยพิจารณาลักษณะของภาระงาน ความต้องการด้านการเชื่อมต่อ ความซับซ้อนในการจัดการ และการแลกเปลี่ยนด้านเศรษฐศาสตร์ ซึ่งส่งผลให้สถาปัตยกรรมหนึ่งเหมาะสมกว่าอีกแบบสำหรับสถานการณ์ที่กำหนด หากคุณกำลังประเมินโครงสร้างพื้นฐาน SAN โดยเฉพาะ บทบาทของ สวิตช์ SAN จำเป็นต้องได้รับการพิจารณาอย่างรอบคอบ เนื่องจากเป็นอุปกรณ์ที่ทำให้การสร้างเครือข่ายการจัดเก็บข้อมูลระดับบล็อก (block-level storage networking) เป็นไปได้และสามารถจัดการได้อย่างมีประสิทธิภาพในระดับขนาดใหญ่ หลังจากจบการอภิปรายนี้ คุณจะมีกรอบแนวคิดเชิงปฏิบัติสำหรับการจับคู่โมเดลการจัดเก็บข้อมูลที่เหมาะสมกับความต้องการจริงของภาระงานของคุณ
ทำความเข้าใจความแตกต่างหลักระหว่าง SAN, NAS และ DAS
แต่ละสถาปัตยกรรมทำหน้าที่อะไรกันแน่
Direct Attached Storage (DAS) คือสิ่งที่ชื่อของมันระบุไว้โดยตรง: อุปกรณ์จัดเก็บข้อมูลที่เชื่อมต่อทางกายภาพกับเซิร์ฟเวอร์หรือเวิร์กสเตชันเพียงเครื่องเดียว โดยไม่มีโครงข่ายเครือข่ายใดๆ อยู่ระหว่างกลาง ซึ่งอาจเป็นฮาร์ดไดรฟ์ภายใน อะเรย์ภายนอกผ่านพอร์ต USB หรือ SAS หรือไดรฟ์ NVMe ที่ติดตั้งโดยตรงลงในโฮสต์ DAS ให้ความหน่วงเวลาต่ำ เนื่องจากไม่มีการส่งผ่านเครือข่าย แต่จะก่อให้เกิด 'โคนเก็บข้อมูลแบบแยกส่วน' (storage silos) กล่าวคือ เซิร์ฟเวอร์แต่ละเครื่องเป็นเจ้าของพื้นที่จัดเก็บข้อมูลของตนเอง และการแบ่งปันความจุนั้นกับโฮสต์อื่นๆ จะต้องอาศัยซอฟต์แวร์เพิ่มเติมหรือการย้ายข้อมูล ซึ่งส่งผลให้เกิดความซับซ้อนและเพิ่มความล่าช้า
ระบบจัดเก็บข้อมูลแบบเชื่อมต่อกับเครือข่าย (Network Attached Storage) นำเสนอเซิร์ฟเวอร์ไฟล์เฉพาะที่ส่งออกไดเรกทอรีที่ใช้ร่วมกันผ่านเครือข่าย IP มาตรฐาน โดยใช้โปรโตคอลต่าง ๆ เช่น NFS, SMB หรือ CIFS ไคลเอนต์หลายตัวสามารถเข้าถึงระบบไฟล์เดียวกันพร้อมกันได้ ซึ่งทำให้ NAS เหมาะสมอย่างยิ่งสำหรับสภาพแวดล้อมที่ต้องทำงานร่วมกัน คลังสื่อ ไดเรกทอรีส่วนบุคคลของผู้ใช้ และเป้าหมายสำหรับการสำรองข้อมูล ที่เก็บข้อมูลจะปรากฏต่อระบบปฏิบัติการเสมือนเป็นระบบไฟล์ระยะไกล และประสิทธิภาพขึ้นอยู่กับแบนด์วิดท์ของเครือข่ายและเวลาแฝง (latency) ที่มีอยู่โดยธรรมชาติในโปรโตคอลการเข้าถึงแบบไฟล์
เครือข่ายพื้นที่จัดเก็บข้อมูล (Storage Area Network) ใช้วิธีการที่แตกต่างโดยสิ้นเชิงด้วยการสร้างเครือข่ายความเร็วสูงเฉพาะสำหรับการรับส่งข้อมูลด้านการจัดเก็บเท่านั้น เซิร์ฟเวอร์เชื่อมต่อกับโครงข่าย SAN ผ่านอุปกรณ์อะแดปเตอร์บัสโฮสต์ (host bus adapters) และมองเห็นปริภูมิจัดเก็บข้อมูล (storage volumes) เหมือนกับอุปกรณ์บล็อกในเครื่อง ซึ่งการเข้าถึงระดับบล็อกนี้มีความสำคัญยิ่งต่อภาระงานที่ต้องการการอ่าน/เขียนดิสก์โดยตรงโดยไม่ผ่านตัวกลางระบบไฟล์ รวมถึงฐานข้อมูลระดับองค์กรส่วนใหญ่ ซอฟต์แวร์ควบคุมการจำลองเสมือน (virtualization hypervisors) และแอปพลิเคชันแบบทำธุรกรรม ขณะที่สวิตช์ SAN ทำหน้าที่เป็นอุปกรณ์เชื่อมต่อหลักที่ทำหน้าที่ส่งต่อเฟรมข้อมูลการจัดเก็บผ่าน Fibre Channel หรือ Ethernet ระหว่างเซิร์ฟเวอร์กับอาร์เรย์จัดเก็บข้อมูลภายในโครงข่ายเฉพาะนี้
ความแตกต่างของโพรโทคอลและเลเยอร์การส่งข้อมูล
DAS ใช้อินเทอร์เฟซบัสโดยตรง เช่น SAS, SATA, NVMe หรือ SCSI รุ่นเก่า ซึ่งเป็นระบบส่งข้อมูลที่มีลักษณะแน่นอนและมีภาระงานต่ำ ทำให้สามารถเพิ่มอัตราการถ่ายโอนข้อมูลสูงสุดสำหรับโฮสต์เพียงเครื่องเดียวได้ ในขณะที่ NAS อาศัยโครงข่าย TCP/IP และโปรโตคอลการแชร์ไฟล์ที่ทำงานอยู่บนโครงข่ายดังกล่าว หมายความว่าประสิทธิภาพของระบบจัดเก็บข้อมูลจะขึ้นอยู่กับความแปรปรวนทั้งหมดของโครงข่ายแบบทั่วไป เว้นแต่ว่าจะมีการบังคับใช้นโยบายคุณภาพการให้บริการ (Quality-of-Service) อย่างรอบคอบ
SAN มักใช้ Fibre Channel เป็นสื่อกลางในการส่งข้อมูล แม้ว่า iSCSI ผ่าน Ethernet และ Fibre Channel ผ่าน Ethernet จะกลายเป็นทางเลือกที่พบเห็นได้บ่อยขึ้นเรื่อยๆ ก็ตาม Fibre Channel ถูกออกแบบมาโดยเฉพาะตั้งแต่เริ่มต้นเพื่อจัดการปริมาณงานด้านการจัดเก็บข้อมูล โดยให้ความหน่วงเวลาที่คาดการณ์ได้ (deterministic latency) การควบคุมการไหลของข้อมูลในตัว (built-in flow control) และการส่งข้อมูลแบบไม่สูญหาย (lossless delivery) สวิตช์ SAN ในสภาพแวดล้อม Fibre Channel ทำหน้าที่กำหนดโซน (zoning) ซึ่งคือการแบ่งส่วนตรรกะของโครงข่าย (fabric) เพื่อให้เส้นทางการเชื่อมต่อระหว่างโฮสต์กับอุปกรณ์จัดเก็บข้อมูลที่ได้รับอนุญาตเท่านั้นที่มองเห็นได้ ฟีเจอร์นี้ทำหน้าที่ทั้งในด้านความปลอดภัยและกลไกการแยกประสิทธิภาพ เพื่อป้องกันไม่ให้งานต่างๆ รบกวนกันที่ระดับโครงข่าย
การจับคู่สถาปัตยกรรมกับลักษณะของปริมาณงาน
เมื่อ DAS เป็นเครื่องมือที่เหมาะสม
DAS ยังคงมีความเกี่ยวข้องและมักเป็นตัวเลือกที่เหมาะสมที่สุดสำหรับภาระงานแบบเซิร์ฟเวอร์เดียว ซึ่งไม่จำเป็นต้องมีการแบ่งปันทรัพยากร และประสิทธิภาพการอ่าน/เขียน (I/O) สูงสุดคือสิ่งที่ให้ความสำคัญเป็นพิเศษ โหนดวิเคราะห์ข้อมูลประสิทธิภาพสูง เซิร์ฟเวอร์เรนเดอร์เฉพาะทาง การใช้งานคอมพิวติ้งแบบเอจ (edge computing) และเวิร์กสเตชันสำหรับการพัฒนา ล้วนได้รับประโยชน์จาก DAS เนื่องจากการไม่มีเลเยอร์เครือข่ายช่วยกำจัดความแปรผันของความหน่วงเวลา (latency variability) ได้อย่างสมบูรณ์ เมื่อภาระงานทำงานบนโฮสต์เพียงเครื่องเดียว และโฮสต์นั้นไม่น่าจะถูกย้าย (migrated) หรือกระจายโหลด (load-balanced) DAS จึงช่วยหลีกเลี่ยงต้นทุนและความซับซ้อนของโครงสร้างพื้นฐานระบบจัดเก็บข้อมูลแบบแชร์ โดยไม่สูญเสียประสิทธิภาพหรือคุณสมบัติที่สำคัญแต่อย่างใด
DAS ยังเป็นจุดเริ่มต้นที่สมเหตุสมผลสำหรับองค์กรที่อยู่ในช่วงต้นของการพัฒนาโครงสร้างพื้นฐานอีกด้วย ต้นทุนการลงทุนมีระดับต่ำกว่า การกำหนดค่าระบบทำได้ง่ายกว่า และภาระในการดำเนินงานต่ำมาก อย่างไรก็ตาม ความท้าทายจะเกิดขึ้นเมื่อมีการขยายตัว: การเพิ่มเซิร์ฟเวอร์หมายถึงการต้องเลือกระหว่างการจำลองซ้ำระบบจัดเก็บข้อมูล (duplicating storage) หรือการปรับปรุงระบบจัดเก็บข้อมูลแบบใช้ร่วมกัน (retrofitting a shared storage model) ซึ่งโดยทั่วไปแล้วมักส่งผลกระทบต่อระบบมากกว่าการสร้างระบบจัดเก็บข้อมูลแบบใช้ร่วมกันตั้งแต่ต้น หากแผนงานของคุณรวมถึงการใช้เทคโนโลยี virtualization การสร้างคลัสเตอร์ความพร้อมใช้งานสูง (high availability clustering) หรือการจัดเตรียมเซิร์ฟเวอร์อย่างรวดเร็ว การลงทุนในสถาปัตยกรรมระบบจัดเก็บข้อมูลแบบใช้ร่วมกันตั้งแต่เนิ่นๆ มักจะคุ้มค่า เนื่องจากช่วยหลีกเลี่ยงค่าใช้จ่ายและงานที่เกี่ยวข้องกับการโย้าย้ายระบบในอนาคต
เมื่อ NAS สอดคล้องกับภาระงาน
NAS มีประสิทธิภาพโดดเด่นในสภาพแวดล้อมที่ข้อมูลแบบไม่มีโครงสร้างต้องถูกเข้าถึงพร้อมกันโดยผู้ใช้หรือระบบจำนวนมาก การทำงานร่วมกันเกี่ยวกับไฟล์ การจัดการสินทรัพย์สื่อ ระบบการสร้างซอฟต์แวร์ และโครงสร้างพื้นฐานสำรองข้อมูล เป็นงานที่เหมาะสมอย่างยิ่งกับ NAS เนื่องจากงานเหล่านี้สามารถรองรับหลักการเข้าถึงข้อมูลผ่านไฟล์ได้ และไม่จำเป็นต้องใช้การควบคุมการอ่าน-เขียน (I/O) อย่างเข้มงวดซึ่งระบบจัดเก็บข้อมูลแบบบล็อก (block storage) ให้ไว้ ความสามารถในการแบ่งปันพูลจัดเก็บข้อมูลเดียวกันกับลูกค้าหลายสิบหรือหลายร้อยเครื่อง โดยไม่ต้องติดตั้งระบบจัดเก็บข้อมูลเฉพาะสำหรับแต่ละโฮสต์ ทำให้ NAS มีความน่าสนใจทางเศรษฐศาสตร์มากขึ้นเมื่อใช้งานในระดับใหญ่สำหรับงานที่เน้นการจัดการไฟล์
แพลตฟอร์ม NAS แบบทันสมัยยังรองรับคุณสมบัติการจัดการข้อมูลที่หลากหลาย รวมถึงการสร้างภาพสำรอง (snapshots), การทำซ้ำข้อมูล (replication), การกำจัดข้อมูลซ้ำ (deduplication) และการจัดเก็บข้อมูลตามระดับ (tiering) ซึ่งเพิ่มมูลค่าให้กับสถานการณ์ที่ต้องเก็บข้อมูลในระยะยาว อย่างไรก็ตาม NAS ไม่เหมาะสำหรับฐานข้อมูลแบบทำธุรกรรมที่ไวต่อความหน่วง (latency-sensitive transactional databases) การใช้งานเครื่องเสมือน (virtual machine) จำนวนมากที่ต้องการประสิทธิภาพการอ่าน-เขียนข้อมูล (I/O) ที่สอดคล้องกันในระดับย่อยมิลลิวินาที (sub-millisecond) หรือภาระงานใดๆ ที่พึ่งพาหลักการทำงานของอุปกรณ์บล็อกแบบดิบ (raw block device semantics) การบังคับให้ภาระงานเหล่านี้ทำงานบน NAS มักส่งผลให้เกิดปัญหาด้านประสิทธิภาพซึ่งยากต่อการวิเคราะห์สาเหตุ และมีค่าใช้จ่ายสูงในการแก้ไขหลังจากเกิดปัญหาแล้ว
เมื่อสถาปัตยกรรม SAN ให้คุณค่าสูงสุด
SAN ถูกออกแบบมาโดยเฉพาะสำหรับสภาพแวดล้อมที่มีหลายเซิร์ฟเวอร์ต้องใช้พื้นที่จัดเก็บข้อมูลแบบบล็อก (block storage) ที่มีประสิทธิภาพสูงร่วมกัน โดยมีความหน่วง (latency) ที่คาดการณ์ได้ และสามารถย้ายภาระงาน (workloads) ระหว่างโฮสต์ต่าง ๆ ได้อย่างไม่สะดุด (transparently) ระบบคลัสเตอร์ฐานข้อมูลระดับองค์กร ฟาร์มการจำลองเสมือน (virtualization farms) ของ VMware และ Hyper-V การปรับใช้ Oracle RAC (Oracle Real Application Clusters) และระบบที่ทำธุรกรรมสำคัญยิ่ง (mission-critical transactional systems) ทั้งหมดต่างพึ่งพาคุณลักษณะเฉพาะของ SAN ทั้งสิ้น สวิตช์ SAN คือองค์ประกอบที่ทำให้โมเดลโครงข่ายร่วม (shared fabric model) นี้เป็นไปได้ โดยอนุญาตให้เชื่อมต่อเซิร์ฟเวอร์หลายสิบเครื่องและอาร์เรย์จัดเก็บข้อมูลหลายชุดเข้าด้วยกันในรูปแบบโทโพโลยี (topology) ที่รองรับทั้งความซ้ำซ้อน (redundancy) และการแยกประสิทธิภาพ (performance isolation) พร้อมกัน
สวิตช์ SAN ยังให้พื้นฐานการปฏิบัติงานสำหรับคุณสมบัติขั้นสูงต่าง ๆ เช่น การย้ายข้อมูลจัดเก็บแบบเรียลไทม์ (live storage migration), การจัดระดับข้อมูลจัดเก็บอัตโนมัติ (automated storage tiering) และการขยายปริมาตรข้อมูลแบบไม่รบกวนการทำงาน (non-disruptive volume expansion) นโยบายการแบ่งโซน (zoning policies) ที่บังคับใช้ที่ระดับสวิตช์ SAN ทำให้มั่นใจได้ว่าเซิร์ฟเวอร์สำหรับการทดสอบจะไม่สามารถเข้าถึงปริมาตรข้อมูลจัดเก็บของระบบผลิตภัณฑ์โดยไม่ตั้งใจ และการกำหนดค่าระบบหลายเส้นทาง (multipathing configurations) ที่กำหนดผ่านโครงข่าย (fabric) จะให้การสลับไปใช้เส้นทางสำรองโดยอัตโนมัติ (automatic failover) หากเส้นทางระหว่างโฮสต์กับอาร์เรย์ถูกตัดขาด ความสามารถเหล่านี้ไม่มีให้บริการในสถาปัตยกรรม DAS หรือ NAS เลย ซึ่งเป็นเหตุผลว่าทำไม SAN จึงยังคงเป็นตัวเลือกหลักสำหรับภาระงานระดับองค์กรชั้นหนึ่ง (tier-one enterprise workloads) แม้ว่าการติดตั้งเบื้องต้นจะมีความซับซ้อนสูงกว่า
การประเมินต้นทุนรวมตลอดอายุการใช้งาน (Total Cost of Ownership) สำหรับทั้งสามรูปแบบ
ต้นทุนเงินลงทุนและโครงสร้างพื้นฐาน
DAS มีต้นทุนเริ่มต้นต่ำที่สุด เนื่องจากต้องการเพียงอุปกรณ์จัดเก็บข้อมูลเองและอินเทอร์เฟซแบบท้องถิ่นเท่านั้น ไม่มีโครงสร้างสวิตช์ (switching fabric) ไม่มีระบบสายเคเบิลเฉพาะ และไม่มีซอฟต์แวร์การจัดการเพิ่มเติมที่ต้องซื้อสิทธิ์การใช้งาน สำหรับสภาพแวดล้อมขนาดเล็กที่มีภาระงานที่คาดการณ์ได้และคงที่ ความเรียบง่ายนี้มีคุณค่าอย่างแท้จริง อย่างไรก็ตาม ขีดจำกัดด้านต้นทุนเกิดขึ้นจากประสิทธิภาพต่ำของระบบจัดเก็บข้อมูลแบบแยกส่วน (siloed storage) เมื่อเซิร์ฟเวอร์แต่ละเครื่องจัดการพูลจัดเก็บข้อมูลของตนเองโดยแยกจากกัน อัตราการใช้งานโดยเฉลี่ยมักต่ำ เนื่องจากแต่ละพูลจะต้องออกแบบให้มีขนาดเพียงพอต่อความต้องการสูงสุด (peak demand) แทนที่จะออกแบบตามความต้องการเฉลี่ยทั้งหมดที่กระจายอยู่บนทรัพยากรร่วมกัน
NAS เพิ่มต้นทุนของอุปกรณ์ NAS แบบเฉพาะทางและโครงสร้างพื้นฐานเครือข่ายมาตรฐาน แต่กระจายต้นทุนนั้นไปยังลูกค้าทั้งหมดที่ใช้งานระบบดังกล่าว โครงข่าย IP สมัยใหม่ที่ใช้ในการเชื่อมต่อ NAS มีราคาไม่สูง เนื่องจากอาศัยฮาร์ดแวร์อีเธอร์เน็ตแบบคอมโมดิตี้ การติดตั้ง NAS คุณภาพสูงสามารถมอบคุณค่าที่โดดเด่นสำหรับงานประมวลผลไฟล์ และอินเทอร์เฟซการจัดการมักจะเรียบง่ายกว่าการบริหารจัดการ SAN อย่างมาก ข้อแลกเปลี่ยนที่เกิดขึ้นคือ NAS ต้องแบ่งปันความกว้างของแถบสัญญาณ (bandwidth) กับทราฟฟิกเครือข่ายอื่น ๆ ยกเว้นในกรณีที่ใช้ VLAN สำหรับการจัดเก็บข้อมูลโดยเฉพาะ หรือใช้อินเทอร์เฟซทางกายภาพแยกต่างหาก
SAN มีต้นทุนโครงสร้างพื้นฐานสูงที่สุด เนื่องจากต้องใช้ Host Bus Adapter (HBA) บนเซิร์ฟเวอร์ทุกเครื่อง สายเคเบิลเฉพาะสำหรับ Fibre Channel หรือ iSCSI ระบบสวิตช์ SAN สำหรับแต่ละโหนดในโครงข่าย (fabric) และอาร์เรย์จัดเก็บข้อมูลที่ออกแบบมาเพื่อการเข้าถึงระดับบล็อกโดยเฉพาะ ตัวอย่างสวิตช์ SAN ระดับเริ่มต้น เช่น BR-6505 สามารถนำความสามารถของ SAN มาใช้งานได้อย่างมีประสิทธิภาพในสภาพแวดล้อมขนาดเล็ก โดยไม่จำเป็นต้องลงทุนสูงเท่ากับสวิตช์แบบโมดูลาร์ระดับองค์กรเต็มรูปแบบ ทำให้ SAN เข้าถึงได้ง่ายขึ้นสำหรับองค์กรระดับกลางที่กำลังสร้างโครงสร้างพื้นฐานจัดเก็บข้อมูลแบบคลาวด์ส่วนตัว ต้นทุนนี้จะคุ้มค่าเมื่องานประมวลผล (workloads) นั้นต้องการคุณสมบัติที่ SAN ให้จริง ๆ แต่การติดตั้งโครงสร้างพื้นฐาน SAN เพื่อรองรับงานหลักที่เป็นการแชร์ไฟล์ (file-sharing workloads) นั้นถือเป็นการจับคู่ที่ไม่เหมาะสมและมีราคาแพง
ความซับซ้อนในการดำเนินงานและความต้องการทักษะเฉพาะ
ระบบ DAS ต้องการความเชี่ยวชาญในการดำเนินงานน้อยที่สุด ระบบจัดเก็บข้อมูลถูกจัดการเป็นส่วนหนึ่งของเซิร์ฟเวอร์แต่ละเครื่อง และผู้ดูแลระบบส่วนใหญ่ที่สามารถจัดการเซิร์ฟเวอร์ได้ ก็สามารถจัดการระบบจัดเก็บข้อมูลที่เชื่อมต่อกับเซิร์ฟเวอร์นั้นได้เช่นกัน การบริหารจัดการระบบ NAS ต้องอาศัยความเข้าใจในโปรโตคอลการแชร์ไฟล์ การกำหนดค่าเครือข่าย และการจัดการอุปกรณ์จัดเก็บข้อมูล อย่างไรก็ตาม ทักษะเหล่านี้มีอยู่อย่างแพร่หลาย และอินเทอร์เฟซการบริหารจัดการบนแพลตฟอร์ม NAS รุ่นใหม่ๆ ถูกออกแบบมาเพื่อให้ใช้งานได้ง่าย อย่างไรก็ตาม การวิเคราะห์และแก้ไขปัญหาประสิทธิภาพของระบบ NAS อาจซับซ้อนได้ เมื่อจำเป็นต้องวิเคราะห์ร่วมกันทั้งปัญหาความแออัดของเครือข่ายและการโต้ตอบระหว่างชั้นระบบไฟล์
การบริหารจัดการ SAN ต้องอาศัยความรู้เฉพาะด้านเกี่ยวกับแนวคิดของ Fibre Channel fabric การกำหนดค่าโซนนิ่ง (zoning) ไดรเวอร์ I/O แบบหลายเส้นทาง (multipath) และการจัดการ storage array โดยทั่วไปแล้วสวิตช์ SAN จะเป็นอุปกรณ์ที่ใช้ในการกำหนดนโยบายโซนนิ่ง และข้อผิดพลาดในการตั้งค่าโซนนิ่งอาจก่อให้เกิดปัญหาการเชื่อมต่อที่ซับซ้อนและละเอียดอ่อน ซึ่งต้องใช้เวลาในการวินิจฉัยอย่างมาก การลงทุนในหลักสูตรฝึกอบรมที่เหมาะสมสำหรับผู้ดูแลระบบ SAN จะคืนผลตอบแทนที่คุ้มค่าโดยช่วยหลีกเลี่ยงข้อผิดพลาดในการกำหนดค่าที่อาจนำไปสู่การหยุดให้บริการในระบบปฏิบัติการจริง ความซับซ้อนในการดำเนินงานถือเป็นต้นทุนที่แท้จริง ซึ่งควรนำมาพิจารณาประกอบในการคำนวณต้นทุนรวมในการเป็นเจ้าของ (Total Cost of Ownership) ควบคู่ไปกับราคาฮาร์ดแวร์
ความสามารถในการปรับขนาดและการเตรียมความพร้อมสำหรับอนาคตของการตัดสินใจด้านการจัดเก็บข้อมูล
สถาปัตยกรรมแต่ละแบบสามารถปรับขนาดได้อย่างไร
ระบบ DAS สามารถปรับขนาดแบบแนวตั้ง (Vertical Scaling) ได้ ซึ่งหมายความว่าคุณเพิ่มความสามารถในการจัดเก็บข้อมูลให้กับเซิร์ฟเวอร์แต่ละเครื่อง อย่างไรก็ตาม เมื่อถึงจุดหนึ่ง การปรับขนาดด้วยวิธีนี้จะไม่เหมาะสมอีกต่อไป เนื่องจากช่องสำหรับติดตั้งไดรฟ์ในตัวเรือนเซิร์ฟเวอร์เต็มแล้ว หรือเนื่องจากประสิทธิภาพของหน่วยจัดเก็บข้อมูลภายในไม่สามารถรองรับการเติบโตของแอปพลิเคชันได้ หรือเนื่องจากภาระงานในการจัดการพูลหน่วยจัดเก็บข้อมูลแยกต่างหากบนเซิร์ฟเวอร์หลายสิบเครื่องนั้นหนักเกินกว่าจะรับมือได้ ทั้งนี้ ระบบ DAS มักไม่สามารถปรับขนาดได้อย่างมีประสิทธิภาพในสภาพแวดล้อมที่ใช้เซิร์ฟเวอร์หลายเครื่อง โดยไม่ต้องทบทวนและออกแบบสถาปัตยกรรมใหม่อย่างรอบด้าน
ระบบ NAS สามารถปรับขนาดได้ดีสำหรับความจุในการจัดเก็บไฟล์ และแพลตฟอร์ม NAS รุ่นใหม่ๆ รองรับการกำหนดค่าแบบคลัสเตอร์ (Clustering) ซึ่งช่วยให้ทั้งความจุและประสิทธิภาพสามารถเพิ่มขึ้นได้โดยการเพิ่มโหนดเข้าไปในคลัสเตอร์ สำหรับภาระงานประเภทไฟล์ที่มีปริมาณเพิ่มขึ้นมากกว่าความต้องการด้าน I/O ระบบ NAS จึงเป็นทางเลือกที่เหมาะสมและคุ้มค่าสำหรับการขยายระบบ อย่างไรก็ตาม ระบบ NAS มีข้อจำกัดเมื่อต้องปรับขนาดเพื่อตอบสนองความต้องการด้าน I/O ของภาระงานแบบทำธุรกรรม (Transactional Workloads) เนื่องจากชั้นระบบไฟล์ (File System Layer) ก่อให้เกิดภาระงานเพิ่มเติม (Overhead) ซึ่งไม่สามารถกำจัดออกได้ไม่ว่าจะเพิ่มฮาร์ดแวร์มากเพียงใด
ระบบ SAN สามารถปรับขนาดได้พร้อมกันในหลายมิติ สามารถเชื่อมต่ออาร์เรย์จัดเก็บข้อมูลเพิ่มเติมเข้ากับโครงข่าย (fabric) สามารถเพิ่มเซิร์ฟเวอร์ใหม่เป็นโฮสต์ และสามารถเชื่อมต่ออุปกรณ์สวิตช์ SAN เพิ่มเติมเข้าด้วยกันเพื่อขยายโครงสร้างของโครงข่ายได้ โครงข่าย Fibre Channel รองรับการเชื่อมโยงระหว่างสวิตช์ (inter-switch links) ซึ่งช่วยให้โดเมนสวิตช์ที่แยกจากกันสามารถแบ่งปันทรัพยากรและตารางการกำหนดเส้นทางร่วมกัน ทำให้สภาพแวดล้อมขนาดใหญ่สามารถขยายโครงข่ายได้โดยไม่จำเป็นต้องออกแบบโครงสร้างใหม่ทั้งหมด สำหรับองค์กรที่คาดว่าจะมีปริมาณงานเพิ่มขึ้นอย่างมีนัยสำคัญ หรือมีวงจรการจัดเตรียมเซิร์ฟเวอร์บ่อยครั้ง แบบจำลองการปรับขนาดของ SAN จึงถือเป็นข้อได้เปรียบที่สำคัญเหนือทั้ง NAS และ DAS
ข้อพิจารณาเกี่ยวกับคลาวด์แบบไฮบริดและคลาวด์ส่วนตัว
เมื่อองค์กรต่างๆ สร้างสภาพแวดล้อมคลาวด์ส่วนตัวเพิ่มขึ้นโดยใช้แพลตฟอร์มการจำลองเสมือน (virtualization platforms) คำถามเกี่ยวกับสถาปัตยกรรมการจัดเก็บข้อมูลจึงมีมิติเพิ่มเติมมากขึ้น VMware ที่ใช้งาน vSphere, vMotion และ vSAN จำเป็นต้องอาศัยระบบจัดเก็บข้อมูลแบบบล็อกที่ใช้ร่วมกัน (shared block storage) เพื่อรองรับการย้ายเครื่องเสมือน (virtual machines) แบบสด (live migration) ระหว่างโฮสต์ต่างๆ หากไม่มีโครงสร้างพื้นฐานการจัดเก็บข้อมูลแบบแชร์ (shared storage fabric) การย้ายแบบสดจะไม่สามารถทำได้ และคุณสมบัติด้านความพร้อมใช้งานสูง (high availability) ก็จะไม่สามารถทำงานตามที่ออกแบบไว้ได้ สวิตช์ SAN จึงถือเป็นองค์ประกอบพื้นฐานของโครงสร้างพื้นฐาน VMware ทุกแห่งที่ให้ความสำคัญกับความพร้อมใช้งาน
สถาปัตยกรรมคลาวด์แบบไฮบริดที่รวมโครงสร้างพื้นฐาน SAN ภายในองค์กรเข้ากับชั้นการจัดเก็บข้อมูลบนคลาวด์ จะได้รับประโยชน์จากความสอดคล้องกันที่ SAN มอบให้กับเวิร์กโหลดหลัก ขณะเดียวกันก็ใช้การจัดเก็บข้อมูลแบบวัตถุ (object storage) หรือปริภูมิการจัดเก็บข้อมูลแบบ NAS บนคลาวด์สำหรับข้อมูลรองหรือข้อมูลที่จัดเก็บไว้เป็นระยะยาว การแบ่งหน้าที่ระหว่าง SAN ซึ่งใช้สำหรับข้อมูลหลักที่ต้องการประสิทธิภาพสูง กับชั้นการจัดเก็บข้อมูลอื่นๆ ที่เน้นการเพิ่มความจุสำหรับข้อมูลรอง สะท้อนแนวทางที่สุกงอมในการออกแบบสถาปัตยกรรมการจัดเก็บข้อมูลแบบหลายชั้น ซึ่งสามารถสมดุลระหว่างต้นทุนกับข้อกำหนดด้านประสิทธิภาพตลอดวงจรชีวิตของข้อมูล
สรุปเกณฑ์การเลือกอย่างเป็นรูปธรรม
ปัจจัยที่ต้องประเมินก่อนตัดสินใจเลือก
ปัจจัยที่สำคัญที่สุดในกระบวนการคัดเลือกคือการวิเคราะห์ลักษณะโปรไฟล์การรับส่งข้อมูล (I/O) ของภาระงาน (workloads) ของคุณอย่างแม่นยำ ฐานข้อมูลแบบทำธุรกรรม (transactional databases), โปรแกรมควบคุมเสมือน (virtualization hypervisors) และแอปพลิเคชันที่ดำเนินการรับส่งข้อมูลแบบสุ่มขนาดเล็กบ่อยครั้งภายใต้ข้อกำหนดด้านความหน่วงต่ำ (low latency requirements) ถือเป็นภาระงานสำหรับระบบ SAN ที่เก็บข้อมูลแบบเครือข่าย (Storage Area Network) ที่เก็บไฟล์ (file repositories), เป้าหมายการสำรองข้อมูล (backup targets), สภาพแวดล้อมการแก้ไขร่วมกัน (collaborative editing environments) และคลังสื่อ (media archives) ถือเป็นภาระงานสำหรับระบบ NAS ที่เก็บข้อมูลแบบเครือข่าย (Network Attached Storage) ส่วนแอปพลิเคชันที่ทำงานบนเซิร์ฟเวอร์เดียวซึ่งมีรูปแบบการเข้าถึงข้อมูลที่คาดการณ์ได้และเป็นแบบท้องถิ่น (local access patterns) ถือเป็นภาระงานสำหรับระบบ DAS ที่เก็บข้อมูลแบบเชื่อมต่อโดยตรง (Direct Attached Storage) การระบุลักษณะโปรไฟล์การรับส่งข้อมูลผิดพลาดเป็นสาเหตุที่พบบ่อยที่สุดของการไม่สอดคล้องกันระหว่างสถาปัตยกรรมระบบ
ความต้องการในการแบ่งปันทรัพยากรก็มีความสำคัญไม่แพ้กัน หากโฮสต์หลายเครื่องจำเป็นต้องเข้าถึงปริภูมิจัดเก็บข้อมูล (storage volumes) หรือระบบไฟล์ (file systems) เดียวกันพร้อมกันแบบพร้อมเวลา DAS จะไม่สามารถใช้งานได้ หากรูปแบบการเข้าถึงนั้นเป็นแบบไฟล์ (file-based) และยอมรับค่าความหน่วง (latency) ได้ NAS จึงเป็นทางเลือกที่เหมาะสมที่สุด แต่หากการเข้าถึงนั้นต้องการความหมายในระดับบล็อก (block-level semantics) และต้องการค่าความหน่วงที่ต่ำและสม่ำเสมอทั่วทั้งปริภูมิจัดเก็บข้อมูลที่ใช้ร่วมกัน SAN จึงเป็นคำตอบที่ถูกต้อง สวิตช์ SAN จะกลายเป็นการลงทุนที่จำเป็นทันทีที่คุณต้องการแบ่งปันการจัดเก็บข้อมูลระดับบล็อก (block storage) ระหว่างโฮสต์มากกว่าสองเครื่องอย่างเชื่อถือได้และจัดการได้อย่างมีประสิทธิภาพ
ข้อกำหนดด้านความสามารถในการใช้งานได้และระบบสำ dựองก็มีอิทธิพลต่อการเลือกด้วยเช่นกัน โครงข่าย SAN ที่มีอุปกรณ์สวิตช์ SAN แบบสำรองซ้ำซ้อนและระบบ multipathing จะช่วยกำจัดจุดล้มเหลวเพียงจุดเดียว (single points of failure) ตลอดทั้งเส้นทางการจัดเก็บข้อมูล อุปกรณ์ NAS สามารถจัดกลุ่ม (clustering) เพื่อให้มีความพร้อมใช้งานสูง (high availability) แต่ชั้นโปรโตคอลไฟล์ (file protocol layer) จะทำให้เกิดข้อจำกัดด้านเวลาในการกู้คืน (recovery time constraints) ซึ่งระบบจัดเก็บข้อมูลแบบบล็อก (block storage) ไม่มีข้อจำกัดดังกล่าว ส่วนระบบ DAS ไม่มีความสามารถในการสำรองเส้นทางโดยธรรมชาติ และพึ่งพาเซิร์ฟเวอร์โฮสต์อย่างสมบูรณ์เพื่อความพร้อมใช้งาน จึงไม่เหมาะสมสำหรับแอปพลิเคชันที่ต้องการเวลาทำงานต่อเนื่อง (continuous uptime) โดยไม่มีช่วงเวลาที่กำหนดไว้ล่วงหน้าสำหรับการบำรุงรักษา
การสร้างกลยุทธ์การจัดเก็บข้อมูลแบบชั้น (Tiered Storage Strategy)
สภาพแวดล้อมที่มีความพร้อมสูงหลายแห่งไม่เลือกใช้สถาปัตยกรรมเพียงแบบเดียว แต่กลับนำเสนอยุทธศาสตร์แบบชั้น (tiered strategy) ซึ่งแต่ละประเภทของสถาปัตยกรรมจะถูกนำไปใช้กับภาระงาน (workloads) ที่เหมาะสมที่สุดสำหรับมัน โดยฐานข้อมูลการผลิตระดับที่หนึ่ง (Tier-one production databases) และที่เก็บข้อมูลเครื่องเสมือน (virtual machine datastores) ทำงานบนโครงสร้างพื้นฐาน SAN ที่มีระบบสวิตช์ SAN เฉพาะเพื่อให้ได้ประสิทธิภาพสูงสุดและความพร้อมใช้งานสูงสุด ส่วนการแชร์ไฟล์ (file sharing) ไดเรกทอรีส่วนบุคคล (home directories) และคลังข้อมูลระดับแผนก (departmental archives) ใช้งานบน NAS ส่วนเซิร์ฟเวอร์พัฒนา (development servers) โหนดขอบเครือข่าย (edge nodes) และอุปกรณ์เฉพาะทาง (single-purpose appliances) ใช้ DAS ซึ่งไม่จำเป็นต้องมีการแชร์ข้อมูล แนวทางแบบชั้นนี้ช่วยเพิ่มประสิทธิภาพด้านต้นทุนโดยหลีกเลี่ยงการลงทุนเกินความจำเป็นในภาระงานที่มีความสำคัญต่ำ ในขณะเดียวกันก็รับประกันว่าระบบที่มีความสำคัญต่อภารกิจ (mission-critical systems) จะได้รับคุณภาพของโครงสร้างพื้นฐานตามที่ต้องการ
การจัดทำกลยุทธ์แบบมีหลายระดับต้องอาศัยการจัดหมวดหมู่ภาระงานอย่างตรงไปตรงมา และความเต็มใจที่จะต้านทานแรงดึงดูดในการปรับใช้สถาปัตยกรรมเพียงแบบเดียวเพียงเพื่อให้เกิดความเป็นหนึ่งเดียวกันในการบริหารจัดการเท่านั้น แต่ละระดับควรได้รับการกำหนดขนาดและออกแบบตามความต้องการที่แท้จริงของภาระงานที่ถูกจัดสรรให้กับระดับนั้น โดยมีเกณฑ์การย้ายข้อมูลที่ชัดเจนสำหรับกรณีที่ภาระงานจำเป็นต้องย้ายขึ้นไปยังระดับที่สูงกว่าเมื่อความต้องการของมันเพิ่มขึ้น การทบทวนการจัดหมวดหมู่เหล่านี้ทุกปีจะช่วยให้มั่นใจว่าสถาปัตยกรรมระบบจัดเก็บข้อมูลยังคงสอดคล้องกับภาระงานที่ให้บริการ แม้ว่าแอปพลิเคชันและเทคโนโลยีที่มีอยู่จะเปลี่ยนแปลงไปอย่างต่อเนื่อง
คำถามที่พบบ่อย
ภาระงานประเภทใดที่มักต้องการสวิตช์ SAN มากที่สุด?
เวิร์กโหลดที่ได้รับประโยชน์สูงสุดจากโครงสร้างพื้นฐาน SAN และจึงจำเป็นต้องใช้สวิตช์ SAN ได้แก่ ฐานข้อมูลเชิงสัมพันธ์ระดับองค์กร คลัสเตอร์การจำลองเสมือน VMware และ Hyper-V การกำหนดค่า Oracle RAC และแอปพลิเคชันใดๆ ที่ส่งคำร้องขอ I/O แบบบล็อกสุ่มขนาดเล็กจำนวนมากในเกณฑ์ความหน่วงเวลาที่ละเอียดอ่อน สวิตช์ SAN ให้การเชื่อมต่อแบบแฟบริกที่ใช้ร่วมกัน ซึ่งทำให้เซิร์ฟเวอร์หลายเครื่องสามารถเข้าถึงอาร์เรย์จัดเก็บข้อมูลเดียวกันได้อย่างมีประสิทธิภาพสม่ำเสมอและมีความสำรองเส้นทาง (path redundancy) หากไม่มีสวิตช์ SAN จะไม่มีแฟบริก และโมเดลการจัดเก็บข้อมูลแบบบล็อกที่ใช้ร่วมกันก็จะไม่สามารถทำงานได้
ธุรกิจขนาดเล็กหรือขนาดกลางสามารถให้เหตุผลในการลงทุนซื้อสวิตช์ SAN ได้หรือไม่?
ใช่ อย่างยิ่งหากสภาพแวดล้อมนั้นใช้งานเทคโนโลยีการจำลองเสมือน (virtualization) หรือต้องการความพร้อมใช้งานสูง (high availability) สำหรับภาระงานการผลิต (production workload) ใดๆ ผลิตภัณฑ์สวิตช์ SAN ระดับเริ่มต้นถูกออกแบบมาโดยเฉพาะเพื่อนำความสามารถของ SAN มาใช้กับการติดตั้งขนาดเล็ก โดยไม่ต้องลงทุนสูงและซับซ้อนเท่ากับสวิตช์แฟบริกไดเรกเตอร์ระดับองค์กรแบบโมดูลาร์เต็มรูปแบบ หากธุรกิจดำเนินการเซิร์ฟเวอร์มากกว่าสองหรือสามเครื่อง ใช้ VMware หรือ Hyper-V สำหรับการรวมระบบ (consolidation) หรือไม่สามารถยอมรับเวลาหยุดให้บริการโดยไม่ได้วางแผนล่วงหน้า (unplanned downtime) บนระบบการผลิตได้ ค่าใช้จ่ายในการจัดหาสวิตช์ SAN มักจะคุ้มค่าเมื่อพิจารณาจากประโยชน์ด้านการดำเนินงานและความพร้อมใช้งานที่มอบให้
ISCSI เปรียบเทียบกับ Fibre Channel อย่างไรในฐานะโปรโตคอลการส่งข้อมูลสำหรับ SAN?
iSCSI ทำงานด้วยโปรโตคอลการจัดเก็บข้อมูลแบบบล็อกผ่านโครงสร้างพื้นฐานอีเธอร์เน็ตมาตรฐาน ซึ่งช่วยลดต้นทุนฮาร์ดแวร์โดยไม่จำเป็นต้องใช้อะแดปเตอร์ไฟเบอร์แชนแนลเฉพาะและสายเคเบิลพิเศษ นอกจากนี้ยังเป็นทางเลือกที่เหมาะสมสำหรับการส่งข้อมูลในระบบ SAN ในสภาพแวดล้อมที่มีข้อกำหนดด้านความหน่วง (latency) ระดับปานกลาง และมีโครงสร้างพื้นฐานอีเธอร์เน็ตอยู่แล้ว ในทางกลับกัน ไฟเบอร์แชนแนลยังคงเป็นตัวเลือกที่นิยมมากกว่าสำหรับงานที่ต้องการประสิทธิภาพสูงสุดและไวต่อความหน่วงมากที่สุด เนื่องจากถูกออกแบบมาโดยเฉพาะเพื่อการรับส่งข้อมูลด้านการจัดเก็บ และให้คุณสมบัติในการส่งมอบข้อมูลอย่างแน่นอน (deterministic delivery) ซึ่งอีเธอร์เน็ตสามารถให้ได้ก็ต่อเมื่อมีการกำหนดค่า QoS อย่างรอบคอบเท่านั้น การเลือกระหว่างสองเทคโนโลยีนี้ขึ้นอยู่กับข้อกำหนดด้านประสิทธิภาพ และความยอมรับต้นทุนสำหรับโครงสร้างพื้นฐานเครือข่ายแบบเฉพาะ (dedicated) เทียบกับแบบรวมศูนย์ (converged)
เกิดอะไรขึ้นเมื่อสวิตช์ SAN ล้มเหลว และความเสี่ยงนี้จัดการอย่างไร?
การล้มเหลวของสวิตช์ SAN ตัวเดียวจะทำให้การเชื่อมต่อระหว่างเซิร์ฟเวอร์กับอาร์เรย์จัดเก็บข้อมูลหยุดชะงัก ยกเว้นกรณีที่มีการออกแบบระบบสำรองไว้ในโครงข่าย (fabric) แล้ว แนวทางปฏิบัติที่ดีที่สุดสำหรับการใช้งาน SAN ในการผลิตคือการใช้อุปกรณ์สวิตช์ SAN อย่างน้อยสองตัวที่ทำงานแยกจากกัน และตั้งอยู่ในโดเมนความล้มเหลวที่แยกจากกัน โดยแต่ละเซิร์ฟเวอร์ต้องมี host bus adapters ที่เชื่อมต่อกับสวิตช์ทั้งสองตัว และมีซอฟต์แวร์ multipath I/O ติดตั้งและกำหนดค่าไว้ในระบบปฏิบัติการ การออกแบบแบบ dual-fabric นี้จะรับประกันว่าการสูญเสียสวิตช์ SAN ตัวใดตัวหนึ่งจะไม่ก่อให้เกิดการหยุดให้บริการเส้นทางการจัดเก็บข้อมูล เนื่องจากโฮสต์ทั้งหมดจะยังคงดำเนินการต่อผ่านสวิตช์ที่ยังทำงานอยู่ได้โดยอัตโนมัติ โดยไม่จำเป็นต้องมีการแทรกแซงหรือสูญเสียข้อมูล
สารบัญ
- ทำความเข้าใจความแตกต่างหลักระหว่าง SAN, NAS และ DAS
- การจับคู่สถาปัตยกรรมกับลักษณะของปริมาณงาน
- การประเมินต้นทุนรวมตลอดอายุการใช้งาน (Total Cost of Ownership) สำหรับทั้งสามรูปแบบ
- ความสามารถในการปรับขนาดและการเตรียมความพร้อมสำหรับอนาคตของการตัดสินใจด้านการจัดเก็บข้อมูล
- สรุปเกณฑ์การเลือกอย่างเป็นรูปธรรม
- คำถามที่พบบ่อย