คำเตือนความเสี่ยง: ระวังความเสี่ยงจากการระดมทุนที่ผิดกฎหมายในนาม 'สกุลเงินเสมือน' 'บล็อกเชน' — จากห้าหน่วยงานรวมถึงคณะกรรมการกำกับดูแลการธนาคารและการประกันภัย
ข่าวสาร
ค้นพบ
ค้นหา
เข้าสู่ระบบ
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt
BTC
ETH
HTX
SOL
BNB
ดูตลาด
กระบวนทัศน์: จะใช้ข้อมูลบนเครือข่ายเพื่อการวิจัยกลยุทธ์ได้อย่างไร?
区块律动BlockBeats
特邀专栏作者
2022-10-21 13:30
บทความนี้มีประมาณ 3703 คำ การอ่านทั้งหมดใช้เวลาประมาณ 6 นาที
แหล่งที่มา โครงสร้าง และเครื่องมือสกัดและประมวลผลข้อมูลบนเครือข่าย

ชื่อเดิม: "การใช้ข้อมูลออนไลน์เพื่อการวิจัยนโยบาย: ตอนที่ 1"

ชื่อระดับแรก

การรวบรวมต้นฉบับ: Kxp, BlockBeats

I. บทนำ

ไม่ค่อยมีการใช้ข้อมูลจริงและรายละเอียดในการกำหนดนโยบาย Crypto ส่วนใหญ่ด้วยเหตุผลสามประการต่อไปนี้:

1. นโยบายที่เกี่ยวข้องส่วนใหญ่ในด้านเทคโนโลยีเกิดใหม่ยังคงอยู่ในระดับของทฤษฎีและการวิเคราะห์เชิงคุณภาพ และข้อมูลจะไม่ค่อยได้ใช้ในช่วงแรก

2. แม้ว่าข้อมูลบนเชนจะเปิดเผยและโปร่งใสทั้งหมด แต่ผู้คนจำเป็นต้องทำงานจำนวนมากให้เสร็จในช่วงเวลาสั้นๆ (นั่นคือ ดึงข้อมูลต้นฉบับโดยตรงจากบล็อกเชน) เพื่อเข้าถึงข้อมูลเหล่านี้ แม้แต่สำหรับ ผู้ปฏิบัติงานพื้นเมืองของ Crypto

3. มีผลิตภัณฑ์ข้อมูลจำนวนน้อยจากบริษัทบล็อกเชน “นิติวิทยาศาสตร์” และผู้จำหน่ายข้อมูล แต่ไม่มีผลิตภัณฑ์ใดที่มีความยืดหยุ่น/ปรับแต่งได้ และไม่ตอบสนองความต้องการของนักวิจัยด้านเศรษฐกิจ/การเงิน

นักวิจัยด้านเศรษฐศาสตร์และการเงินสมัยใหม่หลายคนพลาดโอกาสในการใช้เครื่องมือในการวิเคราะห์ข้อมูล crypto จากการออกแบบ Crypto สามารถให้ข้อมูลแบบละเอียดแก่ใครก็ได้แต่นโยบายส่วนใหญ่ยังคงอาศัยแหล่งข้อมูลอนุกรมเวลาที่รวบรวมไว้ล่วงหน้าจากภายนอก เช่น CoinMarketCap แทนการรับข้อมูลโดยตรงจากแหล่งข้อมูล แล้วไงล่ะ?

เช่นเดียวกับผู้กำหนดนโยบายสามารถดูงบดุลของธนาคารรายใหญ่ทุกแห่งในสหรัฐฯ และเฝ้าดูการเปลี่ยนแปลงเงินฝากของผู้บริโภคทีละวินาที ดังนั้นพวกเขาจึงสามารถดูการออก Stablecoin ทั่วทั้งระบบนิเวศ Ethereum ได้อย่างง่ายดาย แต่การวิเคราะห์เอกสารนโยบาย Stablecoin ส่วนใหญ่ใช้วิธีการวิเคราะห์ที่สำรวจแทน เหตุการณ์สมมุติ

ในบทความนี้ ผมจะอธิบายประเด็นต่อไปนี้โดยละเอียด โดยหวังว่าจะเป็นประโยชน์กับนักวิจัยด้านนโยบายที่ต้องการใช้ข้อมูลออนไลน์:

  • วิธีรับข้อมูลในห่วงโซ่

  • โครงสร้างที่นำมาใช้โดยข้อมูลในห่วงโซ่

  • เครื่องมือพื้นฐานหลายอย่างสำหรับการแยกและใช้ข้อมูลบนเครือข่าย

ในบทความถัดไป ฉันจะสำรวจว่าข้อมูลที่รวบรวมที่นี่สามารถใช้วัดทิศทางของตลาด Crypto ได้อย่างไร ในระหว่างนี้ ฉันจะโพสต์ข้อมูลและโค้ดที่ใช้งานได้ฟรีในตอนท้าย ด้วยการอธิบายวิธีการสืบค้นข้อมูลในบล็อกเชน ฉันหวังว่าจะแสดงให้คุณเห็นถึงวิธีการใหม่ๆ ที่ความเปิดกว้างของ Crypto สามารถเปิดกว้างสำหรับการตัดสินใจเกี่ยวกับข้อมูล

ชื่อระดับแรก

II. วิธีการรับข้อมูลแบบออนไลน์

โดยทั่วไปแล้ว ความพยายามในการรวบรวมข้อมูลควรมุ่งเน้นไปที่หนึ่งบล็อกเชน (Ethereum) และส่วนย่อยของโครงการเฉพาะ โดยหลักแล้วจะเป็นสกุลเงิน USD Stablecoins ที่ได้รับการสนับสนุนจาก Fiat ได้แก่ USDC, Tether, Binance USD, Pax Dollar และ Gemini Dollar วิธีการนี้ใช้ได้กับข้อมูลออนไลน์ แม้ว่าคุณต้องการสร้างชุดข้อมูลอื่น

เครื่องมือสำรวจบล็อกอย่าง Etherscan นั้นยอดเยี่ยมสำหรับการดูสแนปช็อตของธุรกรรมและรวบรวมข้อมูลเกี่ยวกับสัญญาอัจฉริยะเฉพาะ แต่จากประสบการณ์ของฉัน เครื่องมือเหล่านี้มีประโยชน์น้อยกว่าสำหรับการสร้างชุดข้อมูลขนาดใหญ่ เมื่อรวบรวมและประมวลผลข้อมูลดิบ โดยทั่วไปคุณมีสองตัวเลือก: (1) เรียกใช้โหนดแบบเต็มในเครื่อง หรือ (2) ค้นหาฐานข้อมูลที่มีข้อมูลดิบที่เขียนโดยตรงจากห่วงโซ่ วิธีแรกมีความต้องการค่อนข้างสูงสำหรับทักษะระดับมืออาชีพและทรัพยากรคอมพิวเตอร์ ในขณะที่วิธีที่สองสามารถใช้ได้กับทักษะ SQL และ Python พื้นฐานเท่านั้น ดังนั้นเราจะใช้วิธีที่สองที่นี่

ชื่อระดับแรก

III โครงสร้างข้อมูลแบบออนไลน์

ในการตอบคำถามนี้ คุณต้องเข้าใจวัตถุประสงค์ของการประมวลผลข้อมูลของคุณก่อน สำหรับกรณีทดสอบนี้ ฉันตัดสินใจสร้างชุดข้อมูลอนุกรมเวลาขนาดใหญ่สำหรับ Stablecoins หลักที่ได้รับการสนับสนุนจาก Fiat และสังเกตพฤติกรรมบางอย่าง: การผลิตเหรียญ (เช่น การออก Stablecoins) การเผา (เช่น การเลิกใช้ Stablecoins) และการโอน ฉันเลือกที่จะทำการวิจัยด้วยวิธีนี้เนื่องจากผู้กำหนดนโยบายและนักวิชาการกำลังมุ่งเน้นไปที่ Stablecoins ที่ได้รับการสนับสนุนจาก Fiat เป็นหลัก ดังนั้นข้อมูลอาจมีประโยชน์มากในระยะสั้น

เหรียญ Stablecoin หลักหลายตัวที่ใช้สกุลเงินดอลลาร์สหรัฐฯ ได้นำมาตรฐาน ERC-20Token มาใช้ ตามชื่อที่แนะนำ ERC-20 เป็นวิธีมาตรฐานในการสร้างโทเค็นโดยใช้สัญญาอัจฉริยะบน Ethereum หากคุณเข้าใจว่าบล็อกเชนเป็นแผ่นงาน Excel ขนาดยักษ์ที่กระจายอำนาจ สัญญาอัจฉริยะก็คล้ายกับฟังก์ชันของ Excel หลังจากป้อนพารามิเตอร์ในฟังก์ชันแล้ว จะใช้ตรรกะในตัวเพื่อสร้างผลลัพธ์เอาต์พุตเฉพาะ (เช่น ฟังก์ชัน MAX ใช้เพื่อส่งออกค่าสูงสุดระหว่างพารามิเตอร์อินพุต)

เราสามารถค้นหาสัญญาอัจฉริยะได้โดยใช้ที่อยู่ Ethereum ซึ่งเป็นตัวระบุเฉพาะในโครงสร้างข้อมูลบล็อกเชน:

คล้ายกับ API สัญญาอัจฉริยะเป็นโปรแกรมที่ใช้ซ้ำได้ ทุกครั้งที่สัญญาอัจฉริยะได้รับคำสั่งการโต้ตอบ บันทึกของการโต้ตอบจะถูกสร้างขึ้นและบันทึกบนบล็อกเชนโดยโปรโตคอล Ethereum ในรูปแบบของบันทึก และบันทึกเหล่านี้ถือเป็นแหล่งข้อมูลที่เชื่อถือได้เกี่ยวกับกิจกรรมสัญญาอัจฉริยะ

เมื่อสัญญาอัจฉริยะดำเนินการฟังก์ชันเฉพาะ เช่น การเบิร์น ERC-20 Stablecoin เพื่อลบออกจากการหมุนเวียน ฟังก์ชันนั้นและพารามิเตอร์จะถูกบันทึกบนบล็อกเชนเป็นบันทึกธุรกรรม

ในการทำธุรกรรมด้านล่าง Circle ซึ่งเป็นผู้ออก USDC Stablecoin ได้เผา USDC มูลค่า 1,056.92 ดอลลาร์

หากคุณเปลี่ยนไปใช้แท็บ "บันทึก" คุณสามารถดูบันทึกเหตุการณ์ของธุรกรรมได้ ช่องที่เกี่ยวข้องคือ

  • ที่อยู่: ที่อยู่สัญญาของสัญญาอัจฉริยะ ที่อยู่สัญญาของ USDC Stablecoin คือ0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48

  • ชื่อ: ฟังก์ชันที่ดำเนินการโดยสัญญาอัจฉริยะ และพารามิเตอร์ในฟังก์ชัน ในที่นี้ สัญญาอัจฉริยะกำลังเรียกใช้ฟังก์ชันเบิร์น ซึ่งรับพารามิเตอร์ที่ระบุตำแหน่งที่เหรียญที่เบิร์นถูกส่ง (เช่น พูลเบิร์น ซึ่งต้องเป็นที่อยู่ Ethereum) และจำนวนเหรียญที่เบิร์น (จำนวนต้องเป็นจำนวนเต็มที่ไม่ได้ลงนามน้อยกว่า มากกว่า 256 บิต)

ผลลัพธ์ของ Etherscan ยังแสดงหัวเรื่องและฟิลด์ข้อมูล ซึ่งมีข้อมูลที่เกี่ยวข้องส่วนใหญ่ที่เราจำเป็นต้องแยกวิเคราะห์เมื่อวิเคราะห์ธุรกรรม

  • Topic0 คือแฮชของลายเซ็นของฟังก์ชัน โดยพื้นฐานแล้ว จะส่งฟังก์ชันและอาร์กิวเมนต์ผ่านอัลกอริทึมแบบทางเดียวเพื่อรับฟังก์ชันแฮชที่ไม่ซ้ำใคร Ethereum ใช้ฟังก์ชันแฮชของ Keccak-256 และเมื่อคุณป้อนลายเซ็นของฟังก์ชันผ่านอัลกอริทึม Keccak-256 ก็จะสร้างแฮชแบบเดียวกัน ดังนั้นเมื่อใดก็ตามที่แฮชปรากฏในบันทึก คุณจึงมั่นใจได้ว่ากำลังเรียกใช้ฟังก์ชันเดียวกัน

  • Topic1 เป็นพารามิเตอร์ดัชนีของฟังก์ชันเบิร์น ที่นี่ Topic1 คือที่อยู่ที่ส่งโทเค็นเบิร์นไป (หมายเหตุ: หากฟังก์ชันเบิร์นมีพารามิเตอร์มากกว่านี้ พารามิเตอร์เหล่านั้นจะปรากฏเป็นหัวข้อเพิ่มเติม)

  • ช่องข้อมูลที่นี่ระบุจำนวนของโทเค็นที่ถูกเบิร์น

ชื่อระดับแรก

IV. เครื่องมือพื้นฐานในการแยกและประมวลผลข้อมูลบนเครือข่าย

ตามที่ได้กล่าวไปแล้ว ในตัวอย่างนี้ ฉันเลือกที่จะดึงข้อมูลออนเชนจากฐานข้อมูลที่มีอยู่ แทนที่จะเข้าถึงโหนดสดบนเครือข่าย Ethereum เพื่อให้เข้าใจง่าย ฉันแยกตารางข้อมูลดิบจำนวนมากจาก GCP โดยใช้ SQL แล้วล้างข้อมูลเหล่านั้นใน Python โดยใช้ไลบรารีแพนด้า

เมื่อเราดึงตารางจาก GCP เราจะใช้ BigQuery ซึ่งเก็บตารางข้อมูล Ethereum จำนวนมาก ดังที่แสดงในคอลัมน์ด้านซ้ายของภาพด้านล่าง เมื่อคุณคลิกที่ตาราง สคีมาฐานข้อมูลที่เกี่ยวข้องจะปรากฏขึ้น เช่น ตาราง ethereum.logs ในภาพด้านล่าง ในขณะเดียวกัน ที่อยู่ ข้อมูล และหัวข้อที่เกี่ยวข้องจะถูกบันทึกไว้ในข้อมูลบันทึก

ข้อความค้นหาในภาพด้านล่างจะใช้เพื่อแยกบันทึกทั้งหมดในตารางบันทึกที่เกี่ยวข้องกับการโต้ตอบกับสัญญา USDC, Tether USD, Binance USD, Pax Dollar หรือ Gemini Dollar นอกจากข้อมูลใน ethereum.logs แล้ว ข้อมูลเพิ่มเติมบางอย่างก็มีประโยชน์ ดังนั้นฉันจึงรวมข้อมูลในตาราง ethereum.block ซึ่งครอบคลุมค่าน้ำมันและข้อมูลอื่นๆ

ตารางผลลัพธ์สามารถอ่านได้โดยตรงโดย Python และแบ่งย่อยเป็นฟิลด์ต่อไปนี้ด้วยความช่วยเหลือของ pandas dataframe:

  • log_index

  • transaction_hash

  • transaction_index

  • address

  • data

  • topics

  • block_timestamp

  • block_number

  • block_hash

  • number

  • miner

  • size

  • gas_limit

  • gas_used

  • base_fee_per_gas

ชื่อระดับแรก

V. ข้อสรุป

บทความนี้ใช้ข้อมูลบันทึกของ Ethereum และสามารถใช้วิธีเดียวกันนี้เพื่อเข้าถึงข้อมูลต่างๆ บนห่วงโซ่ Python และ SQL เป็นเครื่องมือที่นักเศรษฐศาสตร์และผู้กำหนดนโยบายส่วนใหญ่คุ้นเคย และสามารถสร้างความแตกต่างได้มาก เมื่อเปรียบเทียบกับการเงินแบบดั้งเดิม Crypto มีความโปร่งใสมากกว่า สิ่งนี้ทำให้นักวิจัยสามารถใช้ข้อมูลแบบเรียลไทม์เพื่ออธิบายวิธีการทำงานของระบบการเงินและความเสี่ยงที่อาจเกิดขึ้นได้อย่างทันท่วงที

ลิงค์ต้นฉบับ

ลิงค์ต้นฉบับ

Paradigm
ยินดีต้อนรับเข้าร่วมชุมชนทางการของ Odaily
กลุ่มสมาชิก
https://t.me/Odaily_News
กลุ่มสนทนา
https://t.me/Odaily_CryptoPunk
บัญชีทางการ
https://twitter.com/OdailyChina
กลุ่มสนทนา
https://t.me/Odaily_CryptoPunk
สรุปโดย AI
กลับไปด้านบน
แหล่งที่มา โครงสร้าง และเครื่องมือสกัดและประมวลผลข้อมูลบนเครือข่าย
ดาวน์โหลดแอพ Odaily พลาเน็ตเดลี่
ให้คนบางกลุ่มเข้าใจ Web3.0 ก่อน
IOS
Android