หนึ่งวันของกัญญากับ Big Data และความเป็นส่วนตัว

thainetizen

8 years ago

พินดา พิสิฐบุตร @P_Pinda

ภาพประกอบ ดัดแปลงจากไอคอนของ N.K.Narasimhan

วันๆ หนึ่งเราถูกเก็บข้อมูลส่วนตัวอะไรบ้าง?

ขอแนะนำให้รู้จักกับ…กัญญา

กัญญาเป็นสาวออฟฟิศ วันธรรมดา บัตรแรบบิท (บัตรเติมเงินรถไฟฟ้าบีทีเอส) ของกัญญาจะบันทึกว่า เธอแตะบัตรเข้าบีทีเอสสถานีพระโขนง (7.00 น.) และแตะบัตรออกที่สถานีเพลินจิต (7.25 น.) ขณะอยู่บนรถไฟฟ้า กัญญาจะหยิบสมาร์ตโฟนขึ้นมาคุยไลน์กับเพื่อนเพื่อฆ่าเวลา เมื่อถึงที่ทำงาน สิ่งแรกที่เธอทำคือเปิดคอมพิวเตอร์ เปิดเบราว์เซอร์เพื่อเช็คเมล ส่วนในระหว่างวัน กัญญามักแวบเข้ากูเกิลหาสถานที่ท่องเที่ยวใหม่ๆ และเข้าเว็บไซต์ที่เกี่ยวกับการรักษาสุขภาพและความงาม ทุกวันอาทิตย์บัตรแรบบิทของกัญญาจะบันทึกว่าเธอแตะบัตรเข้าจากสถานีพระโขนงและแตะบัตรออกที่สถานีสยาม กัญญาจะเปิดแอปเฟซบุ๊กเพื่อ “เช็คอิน” ที่ฟิตเนสแห่งหนึ่งแถวพารากอน แน่นอน เพื่อการดูแลสุขภาพที่แม่นยำและเก๋ไก๋ กัญญาย่อมมีแอปเปิลวอตช์ (Apple Watch) ซึ่งสามารถวัดอัตราการเต้นของหัวใจของเธอขณะออกกำลังกาย (142 ครั้งต่อนาทีเพื่อสุขภาพที่ดี) บางครั้งหลังออกกำลังกายเสร็จ กัญญาจะแวะเข้าร้านกาแฟไปนั่งจิบคาปูชิโนคูลๆ และเล่นเน็ตผ่านไวไฟสาธารณะบนไอแพด ก่อนจ่ายค่ากาแฟด้วยบัตรเครดิต กัญญาออกจากร้านกาแฟมาสู่ท้องถนน เธอแวะขยิบตาให้กับกล้องซีซีทีวีหนึ่งทีระหว่างรอข้ามทางม้าลาย และข้ามไปขึ้นบันไดรถไฟฟ้าที่อยู่ฝั่งตรงข้าม ก่อนจะแตะบัตรแรบบิทจากสถานีสยาม (18.00 น.) เพื่อไปแตะบัตรออกที่สถานีพระโขนง (18.20 น.)

วันๆ หนึ่ง กัญญาถูกเก็บข้อมูลอะไรบ้าง ข้อมูลการเดินทางที่บันทึกในบัตรแรบบิท เช่น ตำแหน่งที่แตะบัตรเข้าและออก เวลาที่เดินทาง ความถี่ในการเดินทางแต่ละวัน ซึ่งเชื่อมโยงกับชื่อนามสกุลและที่อยู่ที่เธอต้องกรอกกับผู้ให้บริการตอนลงทะเบียนบัตรแรบบิท ทั้งนี้เพื่อแลกกับส่วนลดร้านอาหารและคุ้กกี้มิสซิสฟิลด์ ขนมโปรดของกัญญา, ข้อความที่กัญญาคุยกับเพื่อนในไลน์ คุยกับเพื่อนคนไหน เวลากี่โมง, ข้อความในอีเมล ข้อมูลในไฟล์แนบที่มากับอีเมล เมลถึงใคร ได้รับเมลจากใคร เวลาเท่าไหร่, หมายเลขไอพีของเครื่องคอมพิวเตอร์ พฤติกรรมการใช้งานอินเทอร์เน็ตซึ่งบ่งบอกถึงรสนิยมของกัญญา เช่น คำค้น ยูอาร์แอลของเว็บไซต์ที่เข้า เนื้อหาในเว็บไซต์ เวลาที่ใช้ในการอยู่ในเว็บไซต์, ข้อมูลสุขภาพ เช่น ข้อมูลอัตราการเต้นของหัวใจ ความดัน, บันทึกว่ากัญญาเคยใช้อินเทอร์เน็ตที่ไหนบ้าง, ข้อมูลในบัตรเครดิตบอกประเภทสินค้าที่ซื้อ จำนวนเงิน ตำแหน่งที่รูดบัตร, กล้องซีซีทีวีเก็บภาพใบหน้าสวยๆ ของกัญญาและพฤติกรรมของเธอขณะรอรถ และอื่นๆ อีกมากมายสาธยายไม่หมด

เราทุกคนก็คล้ายกับกัญญา เพียงแต่มีรสนิยมและวิถีการใช้ชีวิตแบบต่างๆ กันไป บางคนอาจชอบตระเวนเช็คอินตามร้านอาหารมากกว่าเช็คอินที่ฟิตเนส ชอบเข้าเว็บเช็คผลบอลมากกว่าเข้าห้องบลูแพลเนตในพันทิป ไม่ใช่บัตรแรบบิทแต่ใช้บัตรรายเดือนรถไฟฟ้าใต้ดิน และเมื่อถามว่าวันๆ หนึ่งเราถูกเก็บข้อมูลอะไรบ้าง เราก็แทบอยากจะหันไปมองค้อนคนถามเพราะจะให้ตอบได้อย่างไรหมดได้เล่า ก็ในแต่ละวัน เราถูกเก็บข้อมูลมากมายมหาศาลจากเทคโนโลยีที่เราใช้ สมาร์ตโฟน แล็ปท็อป คอมพิวเตอร์ตั้งโต๊ะ บัตรเครดิต บัตรรถไฟฟ้า อุปกรณ์ไอทีแบบสวมใส่ได้ (wearable device) ไวไฟสาธารณะ หรือแม้แต่อาซิ้มอาม่าที่ไม่ใช่อุปกรณ์ไอทีใดๆ ก็ยังต้องถูกเก็บข้อมูลจากกล้องซีซีทีวีที่ติดอยู่จำนวนมากในเมือง

ที่สำคัญ ข้อมูลเหล่านี้ไม่ใช่แค่ข้อมูลในแบบเดิมๆ (เช่น ข้อมูลที่ระบุอยู่ในสำเนาบัตรประชาชนที่เราต้องถ่ายเอกสารให้ธนาคารเวลาจะทำธุรกรรมทางการเงิน) แต่มันเป็น ข้อ-มูล-ขนาด-ใหญ่ หรือที่เราเรียกกันว่า “Big Data” ซึ่งมีลักษณะดังต่อไปนี้ 1. มีปริมาณมาก (volume) อยู่ในระดับเทระไบต์ขึ้นไป 2. มีรูปแบบที่หลากหลาย ไม่ว่าจะเป็น ข้อความ รูปภาพ เสียง ตำแหน่งทางภูมิศาสตร์ พฤติกรรม (variety) และ 3. มีการเปลี่ยนแปลงตลอดเวลาและรวดเร็ว (velocity) เช่น ข้อมูลสภาพการจราจร ข้อมูลตำแหน่งของผู้ใช้ที่แอป Google Map เก็บเอาไว้ ข้อมูลการกดไลก์ แชร์ ทวีตในโซเชียลมีเดีย และอื่นๆ

ในยุค Big Data นอกจากเราจะเก็บข้อมูลมากขึ้นแล้ว เรายังเอาข้อมูลแต่ละชุด (ข้อมูลจากคนละ dataset) มารวมกันมากขึ้นด้วย

ใช่ว่าข้อมูลทุกข้อมูลที่อยู่ใน Big Data จะมีข้อมูลส่วนบุคคล (personal data) ไปเสียทั้งหมด กระนั้นก็ตาม ข้อมูลจำนวนมากใน Big Data ที่กำลังถูกสร้างขึ้นทุกวันนี้มีข้อมูลส่วนบุคคลอยู่ด้วย (ก็ดูข้อมูลอะไรต่อมิอะไรของกัญญาสิ)

ถูกเก็บข้อมูลแล้วไง ใครแคร์

เคยไหมที่เมื่อเข้าเว็บไซต์หนึ่งๆ เว็บไซต์นั้นจะ “ขอ” เก็บข้อมูลการใช้งานของเราเพื่อที่ในอนาคต “เราจะได้แสดงโฆษณาที่ตรงกับรสนิยมของคุณ” หรือ “ส่งมอบบริการที่เหมาะสมกับไลฟ์สไตล์ของคุณ” กัญญาเคยเข้าเว็บไซต์ lagoza.com เพื่อจองห้องพักในโตเกียวสำหรับช่วงซากุระบานที่กำลังจะมาถึง วันต่อมาเมื่อเธอเปิดเว็บบราวเซอร์เพื่อท่องเน็ต โฆษณาที่พักที่โตเกียวโดยเว็บไซต์ดังกล่าวก็ตามหลอกหลอนไม่ว่าเธอจะเข้าไปที่เว็บไซต์ใดเป็นเวลา 1 สัปดาห์เต็ม (จองไปแล้วจ้ะ โตเกียวน่ะ จะโฆษณาหาอะไรอีก)

เคยสงสัยกันไหม ว่าผู้ให้บริการที่เก็บข้อมูล”เล็กๆ น้อยๆ” จำนวนมหาศาล ซึ่งหลายข้อมูลเป็นข้อมูลส่วนตัว ทำอะไรกับข้อมูลเราบ้าง?

ในกรณีข้างต้น เว็บไซต์ lagoza.com เข้าถึงข้อมูลการเข้าเว็บไซต์และการค้นหาของกัญญาผ่านคุกกี้ในเบราว์เซอร์ ก่อนจะนำมาประมวลเพื่อแสดงโฆษณาที่คิดว่าเหมาะสมกับเธอ

นอกจากในธุรกิจโฆษณาแล้ว หลายบริษัทในต่างประเทศใช้ซอฟต์แวร์ที่ช่วยคัดกรองผู้สมัครงานโดยใช้ Big Data เพื่อตัดสินใจว่าจะรับหรือไม่รับใครเข้าทำงาน

ในสหรัฐฯ ศาลในรัฐกว่าร้อยละ 50 ใช้วิธีการคาดการณ์ที่อยู่บนพื้นฐานของการวิเคราะห์ข้อมูลมาเป็นปัจจัยหนึ่งในการตัดสินว่าควรจะให้ปล่อยตัวโดยมีทัณฑ์บนแก่ผู้ต้องหารายหนึ่งๆ หรือไม่

คำถามก็คือ บริษัทผู้ให้บริการ บริษัทที่รับสมัครงาน หรือศาลเหล่านั้นนำข้อมูลอะไรบ้างและมีวิธีการประมวลผลข้อมูลอย่างไร จึงนำมาสู่ผลลัพธ์หนึ่งๆ ซึ่งอาจจะส่งผลกระทบต่อชีวิตของเรา

คำตอบก็คือ การประมวลผลเหล่านี้ ซึ่งส่วนใหญ่ประมวลผลโดยคอมพิวเตอร์ (เนื่องจากข้อมูลที่นำมาประมวลมีจำนวนมาก) ทำงานอยู่ในกล่องดำ (black box) ซึ่งเราหรือเจ้าของข้อมูลไม่รู้ว่ามันทำงานอย่างไร

ความที่เราไม่รู้ว่าการประมวลผลข้อมูล ทำให้เราซึ่งเป็นเจ้าของข้อมูลไร้ซึ่งอำนาจ เป็นเพียงแค่ผู้ถูกจับจ้องแต่ฝ่ายเดียว เราไม่มีทางตรวจสอบความถูกต้องของข้อมูลหรือความถูกต้องของการประมวลผล ซึ่งส่งผลกระทบต่อชีวิตเราได้เลย

ยิ่งในทุกวันนี้ ในยุคของ Big Data และ Open Data (ข้อมูลเปิด) ใครๆ ก็พูดกันว่านี่เป็นยุคทองของข้อมูล ธุรกิจและรัฐบาลกำลังหาวิธีใช้ประโยชน์จากข้อมูลที่มี เราให้ความสำคัญกับข้อมูลและการวิเคราะห์ข้อมูลเสียมากจนบางครั้ง ข้อมูลของเรากลายเป็นตัวแทนความเป็นเราไปเสียแล้ว (ดูอย่างการใช้ซอฟต์แวร์คัดเลือกผู้สมัครงาน บริษัทตัดสินใจรับหรือไม่รับเราโดยอาศัยเพียงข้อมูลของเราที่บริษัทมี) ปัญหาก็คือ แล้วข้อมูลที่มีนั้นเป็นตัวแทนเราได้ถูกต้องแค่ไหน ข้อมูลสามารถมีความลำเอียง หรือถูกวิเคราะห์อย่างผิดพลาด หรือกระทั่งถูกปรับเปลี่ยนด้วยความไม่ประสงค์ดีได้หรือไม่

ความท้าทายของประเทศกำลังพัฒนา

เมื่อข้อมูล โดยเฉพาะข้อมูลส่วนบุคคลถูกนำไปใช้และส่งผลกระทบต่อเรา มาตรการคุ้มครองความเป็นส่วนตัวซึ่งจะช่วยปกป้องเราผู้เป็นเจ้าของข้อมูลเองจึงเป็นสิ่งสำคัญที่ขาดไม่ได้ อย่างไรก็ตาม ในประเทศกำลังพัฒนา พบว่าประเทศเหล่านี้ยังเผชิญความท้าทายในเรื่องการคุ้มครองความเป็นส่วนตัว ไม่ว่าจะเป็น

ประเทศกำลังพัฒนาส่วนใหญ่ไม่ได้เป็นผู้ผลิตเทคโนโลยีเอง แต่เป็นผู้ใช้บริการเทคโนโลยีและบริการออนไลน์ต่างๆ ของต่างประเทศ ทำให้ข้อมูลส่วนบุคคลจำนวนมากถูกเก็บและประมวลผลอยู่นอกเขตอำนาจตามกฎหมายของประเทศ (ข้อมูลส่วนตัวของเราในเฟซบุ๊กถูกเก็บและประมวลผลอยู่ในสหรัฐฯ ข้อมูลการสื่อสารในไลน์ของเราถูกเก็บอยู่ที่เซิร์ฟเวอร์ในประเทศญี่ปุ่น ฯลฯ) ทำให้กฎหมายในประเทศของเราไม่สามารถทำอะไรกับบริษัทเหล่านั้นได้ (แต่สำหรับในบริบทประเทศไทยตอนนี้ นี่อาจเป็นเรื่องดีก็ได้ ยกตัวอย่างเมื่อเดือน ธ.ค. 2557 พรชัย รุจิประภา รัฐมนตรีว่าการกระทรวงเทคโนโลยีสารสนเทศและการสื่อสารเปิดเผยว่ากระทรวงกำลังตรวจตราข้อมูลในไลน์ โดยเฉพาะข้อความเกี่ยวกับสถาบันกษัตริย์และความมั่นคง ไลน์ประเทศไทยได้ออกมายืนยันว่า บริษัทไม่ได้เปิดเผยข้อมูลผู้ใช้ให้กับกระทรวงไอซีทีตามที่เป็นข่าว เพราะข้อมูลดังกล่าวเป็นข้อมูลส่วนบุคคลและในทางสากลมีกฎหมายคุ้มครองอยู่ หากทางการไทยประสานขอข้อมูลมาที่ไลน์ประเทศไทย ต้องมีหมายศาล และขึ้นอยู่กับดุลยพินิจของบริษัทแม่ที่ญี่ปุ่นว่าจะดำเนินการตามที่ขอหรือไม่)
ประเทศกำลังพัฒนาส่วนใหญ่ยังขาดกฎหมายคุ้มครองข้อมูลส่วนบุคคล โดยในประเทศไทยเอง ปัจจุบันเรายังไม่มีกฎหมายคุ้มครองข้อมูลส่วนบุคคลเป็นการทั่วไป (มีแต่คุ้มครองข้อมูลส่วนบุคคลที่อยู่ในความคุ้มครองของรัฐ หรือข้อมูลในบางภาคส่วนเท่านั้น เช่น ภาคที่เกี่ยวกับการธนาคาร)
นอกจากนี้ ความตระหนักในเรื่องความเป็นส่วนตัวกับ Big Data ก็ยังมีไม่มากนัก ไม่ว่าจะเป็นในบรรดาผู้ใช้เน็ต สื่อมวลชน หรือแม้แต่นักออกแบบพัฒนาเทคโนโลยีเองก็ตาม

แล้วเราจะทำอย่างไรกันดี

เมื่อ 3 หลักการคุ้มครองความเป็นส่วนตัวปัจจุบันเชยไปเสียแล้ว

Viktor Mayer-Schönberger ผู้เขียนหนังสือ Big Data: A Revolution That Will Transform How We Live, Work, and Think ระบุว่า ในยุค Big Data สามหลักการหลักที่ใช้คุ้มครองความเป็นส่วนตัวมายาวนาน นั่นก็คือ 1. การแจ้งและขอความยินยอม (notice and consent) 2. การ opt-out (การเลือกออก เช่น เมื่อสมัครบริการออนไลน์หนึ่ง บริการนั้นจะส่งอีเมลข่าวคราวใหม่ๆ มาให้ลูกค้าเป็นประจำ หากเราไม่ต้องการรับอีเมลจากบริการนั้นอีกต่อไป แล้วเราสามารถคลิกยกเลิกการรับอีเมลข่าวสาร หรือ “เลือกออก” ได้) และ 3. การทำให้เป็นนิรนาม (anonymization) อาจจะใช้ไม่ได้ผลอีกต่อไป

เขาให้ความเห็นว่า สาเหตุที่หลักการทั้ง 3 ใช้ไม่ได้ผลนั่นก็เพราะปัญหาได้เปลี่ยนไปแล้ว

สำหรับการแจ้งเตือนและขอความยินยอมนั้น ในยุค Big Data คุณค่าของข้อมูลไม่ได้อยู่ในการเก็บข้อมูลตามจุดประสงค์แรกเริ่ม (primary purpose) อย่างเดียวเท่านั้น ทว่า ข้อมูลนั่นยังมีคุณค่าเมื่อนำมาใช้ในจุดประสงค์อื่นในอนาคต (secondary use) ด้วย ไม่มีใครรู้ได้ในตอนนี้ว่าข้อมูลที่เก็บได้มาจะสามารถนำไปต่อยอดเพื่อสร้างนวัตกรรมอะไรได้อีกในอนาคต เมื่อวัตถุประสงค์ในอนาคตของใช้งานข้อมูลไม่สามารถระบุได้ตั้งแต่ตอนที่ข้อมูลดังกล่าวถูกจัดเก็บในตอนแรก บริษัทที่เก็บข้อมูลของคุณจะเขียนวัตถุประสงค์อะไรไว้ในการแจ้งเตือนกันล่ะ ถ้าตอนนั้นบริษัทยังไม่รู้วัตถุประสงค์ที่ว่าเลย

สำหรับวิธีการ opt-out เขาชี้ว่า ในยุค Big Data ที่ข้อมูลของทุกคนอยู่ในฐานข้อมูลขนาดใหญ่ การ opt-out อย่างไรเสียก็ยังทิ้งร่องรอยไว้ เขายกตัวอย่างกรณีบริการกูเกิลสตรีทวิว (Google Street View) ที่หลังจากถูกร้องเรียนในหลายประเทศว่าละเมิดสิทธิความเป็นส่วนตัว เพราะบริการดังกล่าวจัดเก็บและแสดงภาพถนนและบ้านเรือนของคน ในเยอรมนี คนกลัวว่าภาพบ้านและสวนของตนจะทำให้ขโมยหาเป้าหมายได้ง่ายข้น กูเกิลจึงออกฟังก์ชันให้เจ้าของบ้านสามารถ opt-out จากบริการดังกล่าวได้ด้วยการเบลอภาพบ้านของตน ทว่า ขโมยก็อาจตีความได้ว่า ภาพบ้านเบลอๆ นี่แหละคือเป้าหมายชั้นดี เพราะมันต้องมีอะไรดีๆ ซ่อนอยู่แน่ๆ

ส่วนการทำให้เป็นนิรนามก็ใช้ไม่ได้ผลเช่นกัน การทำให้เป็นนิรนามได้ผลดีกับฐานข้อมูลที่มีข้อมูลอยู่จำนวนน้อย แต่ฐานข้อมูลที่มีข้อมูลจำนวนมากจะทำให้เกิดความเสี่ยงของการ “ระบุตัวตนกลับ” (re-identification)

มาดูยกตัวอย่างความเสี่ยงของการระบุตัวตนกลับกัน งานศึกษาของ Latanya Sweeney (2000) (ดูอ้างอิง) พบว่า ด้วยข้อมูลเพียง 3 ชนิด คือ เพศ รหัสไปรษณีย์ และ วันเดือนปีเกิด เราสามารถระบุตัวคนอเมริกันได้ถึง 87.1% โดยเฉลี่ย โดยตามหลักความน่าจะเป็น เมื่อคำนวณความเป็นไปได้ของการผสมตัวแปร 3 ชนิดคือ เพศ (เป็นไปได้ 2 ค่า ชาย หรือ หญิง) รหัสไปรษณีย์ 5 หลัก และวันเดือนปีเกิดในช่วง 100 ปี รวมกัน จะมีค่าที่ไม่ซ้ำกัน 365,000 ค่า Sweeney ทดลองขอข้อมูลในระดับที่เล็กกว่ารัฐ คือฐานข้อมูลผู้มีสิทธิเลือกตั้งของเขตเลือกตั้ง Cambridge, Massachusett พบว่ามีผู้มีสิทธิลงคะแนนในฐานข้อมูล 54,805 คน ดังนั้นมันเป็นไปได้ที่จะแต่ละคนจะมีข้อมูลสามตัวนี้ไม่ซ้ำกันเลย

ด้วยวิธีการเชื่อมโยงด้วย เพศ รหัสไปรษณีย์ และวันเดือนปีเกิดนี้ เมื่อนำฐานข้อมูลสุขภาพที่มีประวัติการรักษาพยาบาลมาเชื่อมโยงกับฐานข้อมูลผู้มีสิทธิลงคะแนนที่มีชื่อ สกุล และที่อยู่จะทำให้เราสามารถระบุกลับ (re-identify) ได้ว่าระเบียนในฐานข้อมูลไหนเป็นข้อมูลของใคร รวมถึงสามารถเชื่อมโยงกับข้อมูลอ่อนไหวอื่นๆ เช่น ชาติพันธุ์ และพรรคการเมืองที่เป็นสมาชิกในฐานข้อมูลทั้งสองได้ด้วย และวิธีการนี้ยังสามารถนำไปทำซ้ำกับฐานข้อมูลอื่นๆ จนให้ภาพที่ละเอียดมากขึ้นๆ ของเจ้าของข้อมูลได้ (อ่านรายละเอียดในเรื่องนี้เพิ่มเติม)

ข้อเสนอสำหรับการคุ้มครองความเป็นส่วนตัวยุค Big Data

Mayer-Schönberger จึงเสนอวิธีการคุ้มครองความเป็นส่วนตัวและคุ้มครองบุคคลเจ้าของข้อมูลที่เหมาะสมกับยุค Big Data ดังนี้

1. เราควรจะเปลี่ยนจาก “การขอความยินยอม” จากผู้ใช้และเน้นไปที่ “ความรับผิด” ของผู้เก็บใช้ประโยชน์จากข้อมูลแทน (data users’ accountability)

2. ให้ความสำคัญความโปร่งใส เขาเสนอว่า ข้อมูลและอัลกอริธึมที่ใช้ประมวลผลข้อมูลควรจะต้องถูกทำให้เข้าถึงได้, ควรมีการให้ใบรับรองกับอัลกอริธึมที่ใช้ประมวลผล ว่าอัลกอริธึมดังกล่าวเหมาะสมและสมเหตุสมผล, สำหรับอัลกอริธึมที่ถูกนำไปใช้ในเรื่องที่อ่อนไหวบางเรื่อง โดยผู้ที่ทำหน้าที่ประเมินอัลกอริธึมคือผู้เชี่ยวชาญซึ่งเป็นบุคคลที่ 3, ต้องมีกระบวนการที่ทำให้คนสามารถพิสูจน์ให้เห็นได้ว่า การคาดการณ์เกี่ยวกับตนที่ถูกประมวลออกมาจากข้อมูลและอัลกอริธึมหนึ่งๆ นั้นผิดพลาดหรือไม่ตรงกับความเป็นจริง

3. เขาเห็นว่า เราควรมีวิชาชีพและสถาบันใหม่ที่เขาเรียกว่า “อัลกอริทมิสต์”(algorithmist) หรือขอแปลในที่นี้ว่า “นักอัลกอริทึม”

ยุคสมัยใหม่ ยุคของอัลกอริทมิสต์

Mayer-Schönberger เสนอว่า การคุ้มครองความเป็นส่วนตัวในยุค Big Data ควรจำเป็นต้องมีบุคคลที่เรียกว่า “อัลกอริทมิสต์” (algorithmist) แม้คำนี้จะฟังดูคล้ายภาษาเอลฟ์และอาจเป็นชื่อตัวละครสักตัวในเดอะฮอบบิต ทว่าที่จริงแล้ว อัลกอริทมิสต์มาจากคำว่า อัลกอริทึม (แปลตรงตัวว่า ลำดับการแก้ปัญหา ซึ่งเป็นวิธีที่คอมพิวเตอร์ใช้ในการประมวลผล)

Mayer-Schönberger ระบุว่า นักอัลกอริทึมจะต้องเป็นบุคคลซึ่งเชี่ยวชาญในด้านวิทยาศาสตร์คอมพิวเตอร์ คณิตศาสตร์ และสถิติ

เขาคนนั้นจะมีหน้าที่ตรวจสอบการวิเคราะห์ข้อมูลและการคาดการณ์ที่ใช้ Big Data เป็นฐาน รวมทั้งประเมินการเลือกข้อมูลและการเลือกใช้เครื่องมือในการคาดการณ์ (รูปแบบอัลกอริทึมและแบบจำลองต่างๆ) รวมทั้งประเมินการตีความผลลัพธ์ที่ได้จากการประมวลผลข้อมูลด้วย

วิชาชีพนักอัลกอริธมิสต์จะต้องยึดหลักการรักษาความลับและความไม่ลำเอียง (confidentiality and impartiality) เฉกเช่นในวิชาชีพการบัญชีและอื่นๆ รวมทั้งมีการกำกับดูแลตนเอง

เมื่อมีเหตุข้อพิพาท นักอัลกอริทึมจะเป็นผู้เข้าถึงอัลกอริทึมและฐานข้อมูลที่นำไปสู่ผลลัพธ์หนึ่ง, ผู้คนที่คิดว่าตนเองได้รับผลกระทบในทางลบจากการคาดการณ์โดยใช้ Big Data สามารถมาปรึกษาและขอความช่วยเหลือกับนักอัลกอริทึมได้ (ในกรณีนี้ นักอัลกอริทึมก็เหมือนเป็นทนาย), และเมื่อต้องขึ้นโรงขึ้นศาล นักอัลกอริทึมก็จะทำหน้าที่พยานผู้เชี่ยวชาญ เป็นทั้งผู้สังเกตการณ์ในคดี และที่ปรึกษาให้กับศาลเพื่อช่วยให้คำปรึกษาในเรื่องเทคนิค

ช่วยกัญญาด้วย

กัญญาพลัดหลงมาใช้ชีวิตอยู่ในศตวรรษที่ 21 นวัตกรรมและบริการออนไลน์ใหม่ๆ ทำให้ชีวิตของกัญญาสะดวกสบาย อย่างไรก็ตาม กัญญาก็ไม่อยากถูกเลือกปฏิบัติเวลาสมัครงาน จากการที่นายจ้างวิเคราะห์ข้อมูลส่วนบุคคลของเธอ โดยซื้อข้อมูลเหล่านั้นมาจากนายหน้าค้าข้อมูล (data broker) ที่รวบรวมข้อมูลของเธอมาจากผู้ให้บริการออนไลน์อีกที หรือไม่อยากให้ใครมารู้ข้อมูลทางการแพทย์บางอย่างของเธอ หรือพูดง่ายๆ กัญญาไม่อยากให้ใครมายุ่งเรื่องส่วนตัวหรือใช้ประโยชน์จากข้อมูลของเธอ ไม่ว่าจะใช้ในการเลือกปฏิบัติ ใช้คาดการณ์และตัดสินเธอ หรือแม้กระทั่งใช้ส่งโฆษณาน่ารำคาญๆ “ที่เหมาะสมกับรสนิยมของคุณ” ช่วยกัญญาด้วย!

อ้างอิง

Big Data: A Revolution That Will Transform How We Live, Work, and Thin โดย Viktor Mayer-Schönberger
Latanya Sweeney. Simple Demographics Often Identify People Uniquely. Carnegie Mellon University, Data Privacy Working Paper 3. Pittsburgh 2000. http://dataprivacylab.org/projects/identifiability/