원저자: Grace Hill
이 기사에 대한 귀중한 통찰력, 피드백 및 리뷰를 제공한 Brian Retford, SunYi, Jason Morton, Shumo, Feng Boyan, Daniel, Aaron Greenblatt, Nick Matthew, Baz, Marcin 및 Brent에게 감사드립니다.
우리 암호화폐 애호가들에게 인공 지능은 한동안 큰 인기를 끌었습니다. 흥미롭게도 AI가 미친 듯이 움직이는 것을 보고 싶어하는 사람은 아무도 없습니다. 블록체인 발명의 본래 의도는 달러가 통제를 벗어나는 것을 방지하는 것이기 때문에 우리도 인공지능이 통제를 벗어나는 것을 막으려고 노력할 수도 있습니다. 또한, 이제 우리는 문제가 발생하지 않도록 보장하는 영지식 증명이라는 새로운 기술을 보유하게 되었습니다. 그러나 AI라는 괴물을 활용하려면 AI가 어떻게 작동하는지 이해해야 합니다.
머신러닝에 대한 간략한 소개
인공 지능은 전문가 시스템에서 신경망, 그래픽 모델, 마지막으로 기계 학습으로 여러 가지 이름 변경을 거쳤습니다. 이 모든 것들은 다른 이름이 붙은 인공 지능의 하위 집합이며 AI에 대한 우리의 이해가 계속해서 커지고 있습니다. 머신러닝에 대해 좀 더 깊이 파고들어 알아보겠습니다.
참고: 오늘날 대부분의 기계 학습 모델은 많은 작업에서 탁월한 성능을 발휘하므로 신경망입니다. 우리는 주로 기계 학습을 신경망 기계 학습이라고 부릅니다.
머신러닝은 어떻게 작동하나요?
먼저, 머신러닝의 내부 작동 방식을 간단히 살펴보겠습니다.
입력 데이터 전처리:
입력 데이터는 모델에 대한 입력으로 사용할 수 있는 형식으로 처리되어야 합니다. 여기에는 일반적으로 유용한 정보를 추출하고 데이터를 입력 행렬 또는 텐서(고차원 행렬)와 같은 적합한 형식으로 변환하기 위한 전처리 및 기능 엔지니어링이 포함됩니다. 이것이 전문가 시스템 접근법이다. 딥러닝의 출현으로 처리 계층이 자동으로 전처리를 처리합니다.
초기 모델 매개변수 설정:
초기 모델 매개변수에는 다중 레이어, 활성화 함수, 초기 가중치, 편향, 학습률 등이 포함됩니다. 일부 매개변수는 모델 정확도를 향상시키기 위해 훈련 중에 최적화 알고리즘으로 조정될 수 있습니다.
훈련 데이터:
입력 데이터는 일반적으로 CNN(컨벌루션 레이어), RNN(순환 레이어) 또는 Self-Attention 레이어와 같은 하나 이상의 특징 추출 및 관계 모델링 레이어로 시작하는 신경망에 공급됩니다. 이러한 레이어는 입력 데이터에서 관련 기능을 추출하고 이러한 기능 간의 관계를 모델링하는 방법을 학습합니다.
그런 다음 이러한 레이어의 출력은 입력 데이터에 대해 다양한 계산 및 변환을 수행하는 하나 이상의 추가 레이어로 전달됩니다. 이러한 계층에는 일반적으로 주로 학습 가능한 가중치 행렬의 행렬 곱셈과 비선형 활성화 함수 적용이 포함되지만, 컨벌루션 신경망의 컨볼루션 및 풀링이나 순환 신경망의 반복과 같은 다른 작업도 포함될 수 있습니다. 이러한 레이어의 출력은 모델의 다음 레이어에 대한 입력 또는 최종 예측 출력으로 사용됩니다.
모델의 출력을 가져옵니다.
신경망 계산의 출력은 일반적으로 네트워크 적용에 따라 이미지 분류 확률, 감정 분석 점수 또는 기타 결과를 나타내는 벡터 또는 행렬입니다. 일반적으로 모델의 목적에 따라 매개변수를 자동으로 업데이트하는 오류 평가 및 매개변수 업데이트 모듈도 있습니다.
위의 설명이 너무 모호해 보인다면 CNN 모델을 사용하여 사과 사진을 식별하는 다음 예를 참조할 수 있습니다.
이미지를 픽셀 값의 행렬로 모델에 로드합니다. 이 행렬은 차원(높이, 너비, 채널)이 있는 3D 텐서로 표현될 수 있습니다.
CNN 모델의 초기 매개변수를 설정합니다.
입력 이미지는 CNN의 여러 숨겨진 레이어를 통과하며, 각 레이어는 컨벌루션 필터를 적용하여 이미지에서 점점 더 복잡한 특징을 추출합니다. 각 레이어의 출력은 비선형 활성화 함수를 통과한 다음 풀링되어 기능 맵의 차원을 줄입니다. 마지막 레이어는 일반적으로 추출된 특징을 기반으로 출력 예측을 생성하는 완전 연결 레이어입니다.
CNN의 최종 출력은 확률이 가장 높은 클래스입니다. 이는 입력 이미지의 예측 레이블입니다.
머신러닝을 위한 신뢰 프레임워크
위의 내용을 기계 학습의 4가지 기본 계층을 포함하는 기계 학습 신뢰 프레임워크로 요약할 수 있습니다. 전체 기계 학습 프로세스는 신뢰할 수 있으려면 이러한 계층이 신뢰할 수 있어야 합니다.
입력: 원시 데이터는 전처리되어야 하며 때로는 비밀로 유지되어야 합니다.
무결성: 입력 데이터는 변조되지 않았으며 악의적인 입력으로 인해 오염되지 않았으며 올바르게 전처리되었습니다.
개인 정보 보호: 필요한 경우 입력 데이터가 공개되지 않습니다.
출력: 정확하게 생성되어 전송되어야 함
완전성: 출력이 올바르게 생성되었습니다.
개인 정보 보호: 필요한 경우 출력이 유출되지 않습니다.
모델 유형/알고리즘: 모델이 올바르게 계산되어야 합니다.
완전성: 모델이 올바르게 수행됩니다.
개인 정보 보호: 필요한 경우 모델 자체 또는 계산이 유출되지 않습니다.
다양한 신경망 모델에는 다양한 사용 사례와 입력에 적합한 다양한 알고리즘과 레이어가 있습니다.
CNN(컨벌루션 신경망)은 작은 입력 영역에 컨볼루션 작업을 적용하여 로컬 패턴과 특징을 캡처할 수 있는 이미지와 같은 그리드형 데이터와 관련된 작업에 일반적으로 사용됩니다.
반면 순환 신경망(RNN)은 숨겨진 상태가 이전 시간 단계의 정보를 캡처하고 시간 종속성을 모델링할 수 있는 시계열 또는 자연어와 같은 순차 데이터에 매우 적합합니다.
Self-attention 레이어는 입력 시퀀스의 요소 간 관계를 캡처하는 데 유용하므로 기계 번역이나 장기 종속성이 중요한 요약과 같은 작업에 효과적입니다.
MLP(다층 퍼셉트론) 등을 포함한 다른 유형의 모델도 존재합니다.
모델 매개변수: 어떤 경우에는 매개변수가 투명하거나 민주적으로 생성되어야 하지만 모든 경우에 변조될 위험이 없습니다.
무결성: 매개변수가 올바른 방식으로 생성, 유지 및 관리됩니다.
개인 정보 보호: 모델 소유자는 모델을 개발한 조직의 지적 재산과 경쟁 우위를 보호하기 위해 기계 학습 모델 매개 변수를 비밀로 유지하는 경우가 많습니다. 이 현상은 트랜스포머 모델의 훈련 비용이 엄청나게 높아질 때까지만 흔했지만 여전히 업계에서는 큰 문제입니다.
머신러닝의 신뢰 문제
머신러닝(ML) 애플리케이션의 폭발적인 성장(CAGR 20% 이상)과 최근 ChatGPT의 인기 등 일상 생활에의 통합이 증가함에 따라 ML에 대한 신뢰 문제는 점점 더 중요해지고 있으며, 무시할 수 없습니다. 따라서 AI의 책임 있는 사용을 보장하고 잠재적인 오용을 방지하려면 이러한 신뢰 문제를 식별하고 해결하는 것이 중요합니다. 그러나 문제는 무엇입니까? 좀 더 자세히 살펴보겠습니다.
투명성이나 증명성이 부족함
신뢰 문제는 두 가지 주요 이유로 오랫동안 머신러닝을 괴롭혀 왔습니다.
개인정보 보호 특성: 위에서 언급한 것처럼 모델 매개변수는 비공개인 경우가 많으며 경우에 따라 모델 입력도 비공개로 유지해야 하므로 자연스럽게 모델 소유자와 모델 사용자 간에 신뢰 문제가 발생합니다.
알고리즘 블랙박스: 기계 학습 모델은 이해하거나 설명하기 어려운 계산에 자동화된 단계가 많이 포함되어 있기 때문에 블랙박스라고도 합니다. 이러한 단계에는 복잡한 알고리즘과 많은 양의 데이터가 포함되어 불확실하고 때로는 무작위 출력이 발생하여 알고리즘이 편견이나 심지어 차별이라는 비난에 취약해집니다.
더 나아가기 전에, 이 기사의 더 큰 가정 중 하나는 모델이 사용할 준비가 되어 있다는 것입니다. 즉, 모델이 잘 훈련되고 목적에 적합하다는 의미입니다. 모델은 모든 상황에 적합하지 않을 수 있으며 모델은 놀라운 속도로 향상됩니다. 기계 학습 모델의 일반적인 수명은 애플리케이션 시나리오에 따라 2개월에서 18개월 사이입니다.
기계 학습의 신뢰 문제에 대한 자세한 분석
모델 훈련 과정에는 몇 가지 신뢰 문제가 있으며, Gensyn은 현재 이 과정을 촉진하기 위해 유효한 증거를 생성하기 위해 노력하고 있습니다. 그러나 이 문서에서는 주로 모델 추론 프로세스에 중점을 둡니다. 이제 기계 학습의 네 가지 구성 요소를 사용하여 잠재적인 신뢰 문제를 찾아보겠습니다.
입력하다:
데이터 소스는 변조 방지됩니다.
모델 운영자는 개인 입력 데이터를 도난당하지 않습니다(개인정보 문제)
모델:
모델 자체는 광고만큼 정확합니다.
계산 과정이 올바르게 완료되었습니다.
매개변수:
모델 매개변수가 변경되지 않았거나 광고된 것과 같습니다.
이 과정에서 모델 소유자에게 가치가 있는 모델 매개변수는 유출되지 않습니다. (프라이버시 문제)
산출:
출력이 정확하다는 것이 입증되었습니다(위의 모든 요소가 개선되면 개선될 수 있음).
머신러닝 신뢰 프레임워크에 ZK를 어떻게 적용하나요?
위의 신뢰 문제 중 일부는 온체인을 통해 해결될 수 있습니다. 입력 및 기계 학습 매개변수를 체인에 업로드하고 체인에서 모델을 계산하면 입력, 매개변수 및 모델 계산의 정확성을 보장할 수 있습니다. 그러나 이 접근 방식은 확장성과 개인정보 보호를 희생할 수 있습니다. Giza는 Starknet에서 이 작업을 수행하고 있지만 비용 문제로 인해 신경망이 아닌 회귀와 같은 간단한 기계 학습 모델만 지원합니다. ZK 기술은 위의 신뢰 문제를 보다 효과적으로 해결할 수 있습니다. 현재 ZKML의 ZK는 일반적으로 zkSNARK를 나타냅니다. 먼저 zkSNARK의 몇 가지 기본 개념을 빠르게 검토해 보겠습니다.
zkSNARK 증명은 w가 무엇인지 알려주지 않고 이 계산 결과 f가 OUT이라는 것이 참인 일부 비밀 입력 w를 알고 있다는 증거입니다. 증명 생성 프로세스는 다음 단계로 요약될 수 있습니다.
증명할 명제를 공식화하십시오: f(x, w)=true
개인 매개변수 w가 있는 기계 학습 모델 f를 사용하여 이 이미지 x를 올바르게 분류했습니다.
명령문을 회로로 변환(산술화): 다양한 회로 구축 방법에는 R 1 CS, QAP, Plonkish 등이 포함됩니다.
다른 사용 사례와 비교하여 ZKML에는 양자화라는 추가 단계가 필요합니다. 신경망 추론은 일반적으로 산술 회로의 주요 영역에서 에뮬레이션하는 데 비용이 매우 많이 드는 부동 소수점 산술을 사용하여 수행됩니다. 다양한 정량화 방법은 정확도와 장비 요구 사항 간의 절충안을 제공합니다.
R 1 CS와 같은 일부 회로 구성 방법은 신경망에 효율적이지 않습니다. 이 부분은 성능 향상을 위해 조정될 수 있습니다.
증명키와 검증키 생성
감시 생성: w=w*, f(x, w)=true인 경우
해시 커밋 생성: 증인 w*는 암호화 해시 함수를 사용하여 해시 값을 생성하기로 커밋합니다. 이 해시는 공개될 수 있습니다.
이는 계산 중에 개인 입력이나 모델 매개변수가 변조되거나 수정되지 않았는지 확인하는 데 도움이 됩니다. 사소한 수정이라도 모델의 동작과 출력에 상당한 영향을 미칠 수 있으므로 이 단계는 매우 중요합니다.
증명 생성: 서로 다른 증명 시스템은 서로 다른 증명 생성 알고리즘을 사용합니다.
이러한 계산을 위해 시간 효율적인 하위선형 프로토콜을 구현하려면 행렬 곱셈 및 컨벌루션 레이어와 같은 기계 학습 작업을 위한 특수 영지식 규칙을 설계해야 합니다.
- Groth 16과 같은 일반 zkSNARK 시스템은 과도한 계산 부하로 인해 신경망을 효율적으로 처리하지 못할 수 있습니다.
- 2020년부터 vCNN, ZEN, ZKCNN 및 pvCNN을 포함하여 모델 추론 프로세스에 대한 ZK 증명을 최적화하기 위해 많은 새로운 ZK 증명 시스템이 등장했습니다. 그러나 대부분은 CNN 모델에 최적화되어 있습니다. MNIST 또는 CIFAR-10과 같은 일부 주요 데이터 세트에만 적용될 수 있습니다.
- 2022년 Daniel Kang Tatsunori Hashimoto, Ion Stoica 및 Yi Sun(Axiom 창립자)은 Halo 2를 기반으로 한 새로운 증명 방식을 제안하여 처음으로 ImageNet 데이터 세트에 대한 ZK 증명 생성을 달성했습니다. 그들의 최적화는 비선형성에 대한 새로운 조회 매개변수를 사용하고 여러 계층에서 하위 회로를 재사용하여 산술 부분에 중점을 둡니다.
- Modulus Labs는 온체인 추론을 위한 다양한 증명 시스템을 벤치마킹한 결과 증명 시간 측면에서 ZKCNN과 plonky 2가 가장 성능이 뛰어나고, 최대 증명자 메모리 사용량 측면에서 ZKCNN과 halo 2가 잘 수행되는 반면 plonky는 잘 수행된다는 사실을 발견했습니다. 그러나 메모리 소비를 희생하면 ZKCNN은 CNN 모델에만 적합합니다. 또한 ZKML을 위해 특별히 설계된 새로운 zkSNARK 시스템과 새로운 가상 머신을 개발하고 있습니다.
검증 증명: 검증자는 증인에 대한 지식 없이 검증 키를 사용하여 검증합니다.
따라서 우리는 영지식 기술을 기계 학습 모델에 적용하면 많은 신뢰 문제를 해결할 수 있음을 보여줄 수 있습니다. 대화형 검증을 사용하는 유사한 기술은 비슷한 결과를 얻을 수 있지만 검증자 측에서 더 많은 리소스가 필요하고 더 많은 개인 정보 보호 문제에 직면할 수 있습니다. 특정 모델에 따라 증거를 생성하는 데 시간과 자원이 필요할 수 있으므로 궁극적으로 이 기술을 실제 사용 사례에 적용할 때 절충점이 있다는 점은 주목할 가치가 있습니다.
현재 솔루션 현황
다음으로, 기존 솔루션은 무엇입니까? 모델 제공자가 ZKML 증명 생성을 원하지 않는 데에는 여러 가지 이유가 있을 수 있습니다. ZKML을 시도할 용기가 있고 솔루션이 타당한 사람들은 모델과 입력 위치에 따라 몇 가지 다른 솔루션 중에서 선택할 수 있습니다.
입력 데이터가 체인에 있는 경우 Axiom을 솔루션으로 사용하는 것을 고려하십시오.
Axiom은 블록체인 데이터에 대한 사용자 액세스를 개선하고 온체인 데이터에 대한 보다 복잡한 디지털 보기를 제공하기 위해 Ethereum용 영지식 보조 프로세서를 구축하고 있습니다. 온체인 데이터에 대한 안정적인 기계 학습 계산이 가능합니다.
- 먼저 Axiom은 ZK-SNARK 검증 프로세스를 통해 무신뢰 검증되는 스마트 계약 AxiomV 0에 이더리움 블록 해시의 Merkle 루트를 저장하여 온체인 데이터를 가져옵니다. 그런 다음 AxiomV 0 StoragePf 계약을 사용하면 AxiomV 0에 캐시된 블록 해시에 의해 제공되는 신뢰 루트에 대해 임의의 과거 이더리움 저장소 증명을 일괄 검증할 수 있습니다.
- 다음으로, 가져온 과거 데이터에서 머신러닝 입력 데이터를 추출할 수 있습니다.
- 그런 다음 Axiom은 검증된 기계 학습 작업을 위에 적용할 수 있으며, 최적화된 Halo 2를 백엔드로 사용하여 각 계산 부분의 유효성을 검증할 수 있습니다.
- 마지막으로 Axiom은 각 쿼리 결과의 zk 증명을 첨부하고 Axiom 스마트 계약은 zk 증명을 확인합니다. 이를 증명하려는 모든 이해관계자는 스마트 계약을 통해 이에 접근할 수 있습니다.
모델을 체인에 배치하는 경우 RISCZero를 솔루션으로 사용하는 것을 고려해 보십시오.
RISC Zero의 ZKVM에서 기계 학습 모델을 실행하면 모델에 포함된 정확한 계산이 올바르게 수행되었음을 증명할 수 있습니다. 계산 및 검증 과정은 사용자가 선호하는 환경에서 오프라인으로 수행하거나, 범용 롤업인 Bonsai Network에서 수행할 수 있습니다.
- 먼저 모델의 소스코드를 RISC-V 바이너리로 컴파일해야 합니다. 이 바이너리가 ZKVM에서 실행되면 출력은 암호화 봉인이 포함된 계산된 영수증과 쌍을 이룹니다. 이 씰은 제3자가 빠르게 확인할 수 있도록 암호화된 imageID(실행 중인 RISC-V 바이너리 식별)를 선언된 코드 출력과 연결하여 계산 무결성에 대한 영지식 인수 역할을 합니다.
- 모델이 ZKVM에서 실행될 때 상태 변화에 대한 계산은 전적으로 VM 내부에서 수행됩니다. 모델의 내부 상태에 대한 정보를 외부로 유출하지 않습니다.
- 모델이 실행되면 결과 봉인은 계산 무결성에 대한 영지식 증명이 됩니다. RISC ZeroZKVM은 실행하는 코드의 영지식 증명을 생성할 수 있는 RISC-V 가상 머신입니다. ZKVM을 사용하면 누구나 확인할 수 있는 암호화된 영수증을 ZKVM 클라이언트 코드에 의해 생성된 것으로 생성할 수 있습니다. 영수증이 발급되면 코드 실행에 대한 다른 정보(예: 제공된 입력)가 공개되지 않습니다.
ZK 증명을 생성하는 특정 프로세스에는 무작위 오라클을 검증자로 사용하는 대화형 프로토콜이 포함됩니다. RISC Zero 영수증의 봉인은 기본적으로 이 상호 작용 계약에 대한 기록입니다.
Tensorflow 또는 Pytorch와 같이 일반적으로 사용되는 기계 학습 소프트웨어에서 모델을 직접 가져오려면 ezkl을 솔루션으로 사용하는 것이 좋습니다.
Ezkl은 zkSNARK의 딥 러닝 모델 및 기타 계산 그래프를 추론하기 위한 라이브러리이자 명령줄 도구입니다.
- 먼저 최종 모델을 .onnx 파일로 내보내고 일부 샘플 입력을 .json 파일로 내보냅니다.
- 그런 다음 ezkl에 .onnx 및 .json 파일을 지정하여 ZKML 문을 증명할 수 있는 ZK-SNARK 회로를 생성합니다.
간단해 보이죠? Ezkl의 목표는 Halo 2 회로에서 높은 수준의 작업을 호출하고 배치할 수 있는 추상화 계층을 제공하는 것입니다. Ezkl은 놀라운 유연성을 유지하면서 많은 복잡성을 추상화합니다. 양자화된 모델에는 자동으로 양자화된 스케일링 인자가 있습니다. 새로운 솔루션과 관련된 다른 증명 시스템으로 변경하는 유연성을 지원합니다. 또한 EVM 및 WASM을 포함한 여러 유형의 가상 머신을 지원합니다.
증명 시스템과 관련하여 ezkl은 증명(검증하기 어려운 증명을 중개자를 통해 검증하기 쉬운 증명으로 변환)과 재귀(메모리 문제를 해결할 수 있지만 halo 2에 적응하기 어려움)를 집계하여 halo 2 회로를 사용자 정의합니다. Ezkl은 또한 고급 증명을 통해 오버헤드를 줄일 수 있는 융합 및 추상화를 통해 전체 프로세스를 최적화합니다.
다른 일반 zkml 프로젝트와 비교하여 Accessor Labs는 AI NPC, 게임플레이 자동 업데이트, 자연어가 포함된 게임 인터페이스 등이 포함될 수 있는 완전한 온체인 게임을 위해 특별히 설계된 zkml 도구를 제공하는 데 중점을 두고 있다는 점은 주목할 가치가 있습니다.
사용 사례는 어디에 있나요?
ZK 기술을 통해 머신러닝으로 신뢰 문제를 해결한다는 것은 이제 사람들의 대화를 따라잡거나 고양이 사진과 개 사진을 비교하는 것보다 더 고위험 및 높은 확실성 사용 사례에 적용될 수 있음을 의미합니다. Web3는 이미 이러한 사용 사례를 많이 탐색하고 있습니다. 대부분의 Web3 애플리케이션은 블록체인에서 실행되거나 실행되도록 의도되어 있으며 블록체인은 안전하게 작동하고 변조하기 어렵고 결정론적 계산을 수행하는 특정 속성을 갖고 있기 때문에 이는 우연이 아닙니다. 검증 가능하게 올바르게 행동하는 AI는 무신뢰 및 분산 환경에서 작동할 수 있는 AI여야 합니다. 그렇죠?
Web3에서 ZK+ML을 적용할 수 있는 사용 사례
많은 Web3 애플리케이션은 보안과 분산화를 위해 사용자 경험을 희생합니다. 보안과 분산화가 최우선 과제이고 인프라 제한이 존재하기 때문입니다. AI/ML은 사용자 경험을 풍부하게 할 수 있는 잠재력을 가지고 있는데, 이는 의심할 여지 없이 도움이 되지만 이전에는 타협 없이는 불가능해 보였습니다. 이제 ZK 덕분에 보안과 분산화 측면에서 큰 희생을 치르지 않고도 AI/ML과 Web3 애플리케이션의 통합을 편안하게 볼 수 있습니다.
기본적으로 이것은 무신뢰 방식으로 ML/AI를 구현하는 Web3 애플리케이션(작성 당시 존재하거나 존재하지 않을 수 있음)이 될 것입니다. 무신뢰란 무신뢰 환경/플랫폼에서 실행되는지 또는 작동을 검증할 수 있는지 여부를 의미합니다. 모든 ML/AI 사용 사례(Web3에서도 마찬가지)가 무신뢰 방식 실행을 요구하거나 선호하는 것은 아닙니다. 다양한 Web3 도메인에서 사용되는 ML 기능의 각 부분을 분석합니다. 그런 다음 ZKML이 필요한 부품, 즉 일반적으로 사람들이 증명을 위해 추가 비용을 지불할 의향이 있는 고가 부품을 식별합니다. 아래에 언급된 대부분의 사용 사례/애플리케이션은 아직 실험적 연구 단계에 있습니다. 따라서 아직 실제 적용과는 거리가 멀다. 그 이유는 나중에 논의하겠습니다.
Defi
Defi는 블록체인 프로토콜과 Web3 애플리케이션 간의 제품 시장 적합성을 입증하는 몇 안 되는 증거 중 하나입니다. 무허가 방식으로 부와 자본을 창출, 저장, 관리하는 능력은 인류 역사상 유례가 없습니다. 우리는 보안과 분산화를 보장하기 위해 AI/ML 모델을 무허가로 실행해야 하는 여러 사용 사례를 확인했습니다.
위험 평가: 현대 금융에는 사기 및 자금 세탁 방지부터 무담보 대출 발행에 이르기까지 다양한 위험 평가를 위한 AI/ML 모델이 필요합니다. 이러한 AI/ML 모델이 검증 가능한 방식으로 작동한다는 것은 검열을 위해 조작되는 것을 방지하여 Defi 제품의 무허가성 특성을 사용하는 것을 방지할 수 있음을 의미합니다.
자산 관리: 자동 거래 전략은 전통적인 금융 및 Defi에 새로운 것이 아닙니다. AI/ML 생성 거래 전략을 적용하려는 시도가 있었지만 몇 가지 분산형 전략만이 성공했습니다. Defi 분야의 일반적인 응용 프로그램에는 현재 Modulus Labs에서 실험한 Rocky Bot이 포함됩니다.
- Rocky Bot: Modulus Labs는 StarkNet의 의사 결정을 위해 AI를 사용하는 거래 봇을 만들었습니다.
-- L1에 자금을 보유하고 Uniswap에서 WEth/USDC를 교환하는 계약입니다.
이는 ML 신뢰 프레임워크의 출력 부분에 적용됩니다. 출력은 L2에서 생성되어 L1으로 전송되어 실행에 사용됩니다. 이 과정에서는 변조할 수 없습니다.
-- 미래 WEth 가격을 예측하기 위해 단순하지만 유연한 3계층 신경망을 구현하는 L2 계약입니다. 계약은 과거 WETH 가격 정보를 입력으로 사용합니다.
이는 입력 및 모델 섹션 모두에 적용됩니다. 과거 가격 정보 입력은 블록체인에서 옵니다. 모델의 실행은 CairoVM(ZKVM의 일종)에서 계산되며, 실행 추적은 검증을 위한 ZK 증명을 생성합니다.
-- 회귀 분석기 및 분류기 훈련을 위한 시각화 및 PyTorch 코드를 위한 간단한 프런트 엔드입니다.
자동화된 시장 조성자 및 유동성 제공: 기본적으로 이는 위험 평가 및 자산 관리에서 진행되는 유사한 노력의 조합이지만 볼륨, 타임라인 및 자산 유형 측면에서 다른 방식입니다. 주식 시장에서 시장 형성을 위해 ML을 사용하는 방법에 대한 많은 연구 논문이 있습니다. 일부 연구 결과가 Defi 제품에 적용되는 것은 시간 문제일 수 있습니다.
- 예를 들어 LyraFinance는 Modulus Labs와 협력하여 스마트 기능으로 AMM을 강화하여 자본 활용도를 더욱 효율적으로 만들고 있습니다.
존경할만한 언급:
- Warp.cc 팀은 훈련된 신경망을 실행하여 비트코인 가격을 예측하는 스마트 계약을 배포하는 방법에 대한 튜토리얼 프로젝트를 개발했습니다. 입력은 RedStoneOracles에서 제공한 데이터를 사용하고 모델은 Arweave에서 Warp 스마트 계약으로 실행되므로 이는 프레임워크의 입력 및 모델 부분과 일치합니다.
- 이것은 첫 번째 반복이고 ZK를 포함하므로 우리의 명예로운 가작에 속하지만 앞으로 Warp 팀은 ZK 부분 구현을 고려하고 있습니다.
게임
게임과 머신러닝에는 교차점이 많습니다.
그림의 회색 영역은 게임 부분의 기계 학습 기능이 해당 ZKML 증명과 결합되어야 하는지 여부에 대한 초기 평가를 나타냅니다. Leela Chess Zero는 ZKML을 게임에 적용한 매우 흥미로운 예입니다.
AI 에이전트
- Leela Chess Zero(LC 0): Modulus Labs가 구축한 완전한 온체인 AI 체스 플레이어로, 커뮤니티의 인간 플레이어 그룹과 대결합니다.
-- LC 0과 인간 집단이 교대로 게임을 합니다(체스에서 그렇듯).
--LC 0의 움직임은 LC 0의 단순화된 회로 맞춤 모델로부터 계산됩니다.
- LC 0 동작에는 Halo 2 스나크 방지 기능이 있어 인간 두뇌 신뢰의 간섭이 없음을 보장합니다. 단순화된 LC 0 모델만 결정을 내릴 수 있습니다.
- 이는 모델 섹션과 일치합니다. 모델 실행에는 계산이 변조되지 않았는지 확인하는 ZK 증명이 있습니다.
데이터 분석 및 예측: 이는 Web2 게임 세계에서 AI/ML의 일반적인 사용이었습니다. 그러나 우리는 이 ML 프로세스에서 ZK를 구현해야 할 이유를 거의 발견하지 못했습니다. 프로세스에 직접적으로 관련되어 너무 많은 가치를 얻지 않으려면 노력할 가치가 없을 것입니다. 그러나 특정 분석과 예측을 사용하여 사용자에 대한 보상을 결정하는 경우 결과가 올바른지 확인하기 위해 ZK가 구현될 수 있습니다.
존경할만한 언급:
- AI Arena는 전 세계 플레이어가 인공 신경망을 기반으로 하는 NFT 캐릭터를 디자인하고, 훈련하고, 전투할 수 있는 이더리움 기반 게임입니다. 전 세계의 유능한 연구원들이 게임 배틀에 참여할 최고의 머신러닝(ML) 모델을 만들기 위해 경쟁합니다. AI Arena는 피드포워드 신경망에 중점을 둡니다. 전반적으로 CNN(컨벌루션 신경망)이나 RNN(순환 신경망)보다 계산 오버헤드가 낮습니다. 하지만 현재 모델은 훈련이 완료된 후에만 플랫폼에 업로드되므로 언급할 가치가 있습니다.
- GiroGiro.AI는 대중이 개인용 또는 상업용 인공 지능을 만들 수 있는 AI 툴킷을 구축하고 있습니다. 사용자는 직관적이고 자동화된 AI 워크플로우 플랫폼을 기반으로 다양한 유형의 AI 시스템을 구축할 수 있습니다. 소량의 데이터만 입력하고 알고리즘(또는 개선할 모델)을 선택함으로써 사용자는 자신이 염두에 두고 있는 AI 모델을 생성하고 활용할 수 있습니다. 프로젝트가 매우 초기 단계에 있지만 GiroGiro가 게임 금융 및 메타버스 중심 제품에 어떤 영향을 미칠 수 있을지 매우 기대되기 때문에 명예로운 가작으로 포함시켰습니다.
DID와 소셜
DID와 소셜 공간에서 Web3와 ML의 교차점은 현재 주로 인간 증명과 자격 증명 영역에 있으며, 다른 부분은 개발될 수 있지만 더 오랜 시간이 걸릴 것입니다.
인간의 증거
- Worldcoin은 사기성 확인을 시도하는 대신 Orb라는 장치를 사용하여 누군가가 실제 사람인지 확인합니다. 다양한 카메라 센서와 기계 학습 모델을 통해 얼굴과 홍채 특징을 분석하여 이를 수행합니다. 이러한 결정이 내려지면 Orb는 사람들의 홍채 사진을 찍고 여러 기계 학습 모델과 기타 컴퓨터 비전 기술을 사용하여 개인 홍채 패턴의 가장 중요한 특징을 디지털로 표현한 홍채 코드를 생성합니다. 구체적인 등록 단계는 다음과 같습니다.
-- 사용자는 휴대폰에서 세마포어 키 쌍을 생성하고 QR 코드를 통해 해시된 공개 키를 Orb에 제공합니다.
-- Orb는 사용자의 홍채를 스캔하고 사용자의 IrisHash를 로컬에서 계산합니다. 그런 다음 해시된 공개 키와 IrisHash가 포함된 서명된 메시지를 등록 주문 노드로 보냅니다.
-- 순차 노드는 Orb의 서명을 확인한 다음 IrisHash가 이미 데이터베이스에 있는 서명과 일치하는지 확인합니다. 고유성 검사를 통과하면 IrisHash와 공개 키가 저장됩니다.
- Worldcoin은 오픈 소스 Semaphore 영지식 증명 시스템을 사용하여 IrisHash의 고유성을 연결하지 않고 사용자 계정의 고유성으로 변환합니다. 이를 통해 새로 등록된 사용자가 WorldCoin을 성공적으로 청구할 수 있습니다. 다음과 같이 진행하세요:
-- 사용자의 애플리케이션은 로컬에서 지갑 주소를 생성합니다.
-- 애플리케이션은 세마포어를 사용하여 이전에 등록된 공개 키의 개인 키를 소유하고 있음을 증명합니다. 이는 영지식 증명이기 때문에 어떤 공개 키인지 공개하지 않습니다.
-- 증명은 시퀀서로 다시 전송되어 증명을 확인하고 제공된 지갑 주소에 토큰을 입금하는 프로세스를 시작합니다. 소위 부품은 증거와 함께 전송되므로 사용자는 보상을 두 번 요청할 수 없습니다.
- WorldCoin은 ZK 기술을 사용하여 ML 모델의 출력이 사용자의 개인 데이터 사이에 상관관계가 없기 때문에 사용자의 개인 데이터를 공개하지 않도록 보장합니다. 이 경우, 출력이 원하는 방식으로(이 경우에는 개인적으로) 전송되고 사용되도록 보장하므로 신뢰 프레임워크의 출력 부분에 속합니다.
행동으로 입증됨
- Astraly는 StarkNet의 평판 기반 토큰 발행 플랫폼으로, 최신 및 최고의 StarkNet 프로젝트를 찾고 지원하는 데 사용됩니다. 평판을 측정하는 것은 단순한 지표로는 쉽게 수량화할 수 없는 추상적인 개념이기 때문에 어려운 작업입니다. 복잡한 지표를 다룰 때 더 포괄적이고 다양한 입력이 더 나은 결과를 생성하는 경향이 있습니다. 이것이 바로 Astraly가 ML 모델을 사용하여 보다 정확한 평판 평가를 제공하기 위해 Modulus Labs에 도움을 요청한 이유입니다.
개인화된 추천 및 콘텐츠 필터링
- 트위터는 최근 오픈 소스가 되었습니다."당신을 위한"(For You) 타임라인의 알고리즘이지만 트윗 순위에 사용되는 ML 모델의 가중치가 비밀로 유지되므로 사용자는 알고리즘이 올바르게 작동하는지 확인할 수 없습니다. 이는 편견과 검열에 대한 우려를 불러일으킵니다.
- 그러나 Daniel Kang, Edward Gan, Ion Stoica, Yi Sun은 ezkl을 사용하여 모델 가중치를 공개하지 않고 트위터 알고리즘의 실제 작동을 입증함으로써 개인 정보 보호와 투명성의 균형을 맞추는 데 도움이 되는 솔루션을 제공했습니다. ZKML 프레임워크를 사용함으로써 트위터는 순위 모델의 특정 버전을 약속하고 특정 사용자 및 트윗에 대한 특정 최종 결과 순위를 생성한다는 증거를 게시할 수 있습니다. 이 솔루션을 사용하면 사용자는 시스템을 신뢰하지 않고도 계산이 올바른지 확인할 수 있습니다. ZKML을 더욱 유용하게 만들기 위해 해야 할 일이 아직 많이 남아 있지만 이는 소셜 미디어의 투명성을 높이기 위한 긍정적인 단계입니다. 따라서 이는 ML 신뢰 프레임워크에 속합니다."모델"부분.
사용 사례 관점에서 ML 신뢰 프레임워크 재검토
Web3에서 ZKML의 잠재적인 사용 사례는 아직 초기 단계에 있지만 무시할 수는 없습니다. 아래 그림을 반복해 보세요.
ZKML 서비스 제공업체는 주로 ML 신뢰 프레임워크의 모델 및 매개변수 부분에 중점을 둡니다. 지금 우리가 보고 있는 매개변수와 관련된 대부분의 내용은 모델과 더 관련되어 있습니다. 입력 및 출력 부분은 데이터 소스 또는 데이터 대상으로서 블록체인 기반 솔루션에 의해 더 많이 처리된다는 점에 유의하는 것이 중요합니다. ZK나 블록체인만으로는 완전한 신뢰성을 얻을 수 없지만 결합하면 가능합니다.
대규모 적용과는 얼마나 먼가요?
마지막으로, 우리는 ZKML의 현재 타당성 상태와 ZKML의 대규모 적용이 얼마나 멀리 떨어져 있는지에 집중할 수 있습니다.
Modulus Labs의 논문은 Worldcoin(엄격한 정확도 및 메모리 요구 사항 포함) 및 AI Arena(비용 효율성 및 시간 요구 사항 포함)를 테스트하여 ZKML 애플리케이션의 타당성에 대한 일부 데이터와 통찰력을 제공합니다.
Worldcon이 ZKML을 사용한다면 증명자의 메모리 소비는 상용 모바일 하드웨어의 성능을 초과할 것입니다. AI 아레나 대회에서 ZKML을 사용한다면 ZKCNN을 사용하면 시간과 비용이 100배(기존 0.008초 대비 0.6초) 증가하게 된다. 따라서 불행히도 시간과 메모리 사용량을 증명하기 위해 ZKML 기술을 직접 적용하는 데는 둘 다 적합하지 않습니다.
증거 크기와 검증 시간은 어떻습니까? Daniel Kang, Tatsunori Hashimoto, Ion Stoica 및 Yi Sun의 논문을 참고할 수 있습니다. 아래와 같이 DNN 추론 솔루션은 ImageNet(모델 유형: DCNN, 16개 레이어, 340만 매개변수)에서 79%의 정확도를 달성할 수 있으며, 검증 시간은 10초에 불과하고 증명 크기는 5952바이트입니다. 또한 zkSNARK는 단 0.7초의 확인 시간으로 59% 정확도로 축소될 수 있습니다. 이러한 결과는 ImageNet 규모 모델의 zkSNARKing이 증명 크기 및 검증 시간 측면에서 실현 가능함을 보여줍니다.
현재 주요 기술적 병목 현상은 증명 시간과 메모리 소비입니다. web3의 경우 ZKML을 적용하는 것은 아직 기술적으로 가능하지 않습니다. ZKML은 AI 발전을 따라잡을 가능성이 있나요? 몇 가지 경험적 데이터를 비교할 수 있습니다.
머신러닝 모델 개발 속도: 2019년 출시된 GPT-1 모델은 1억 5천만 개의 매개변수를 갖고 있는 반면, 2020년에 출시된 최신 GPT-3 모델은 1,750억 개의 매개변수를 가지고 있어 단 2년 만에 매개변수 수가 1,166배 증가했습니다. 년.
영지식 시스템의 최적화 속도: 영지식 시스템의 성능 성장은 기본적으로 무어의 법칙 속도를 따릅니다. 거의 매년 새로운 영지식 시스템이 등장하고 있으며, 증명자 성능의 급속한 성장은 한동안 계속될 것으로 예상됩니다.
이 데이터로 판단하면, 머신러닝 모델이 매우 빠르게 발전하고 있음에도 불구하고 영지식 증명 시스템의 최적화 속도도 꾸준히 증가하고 있습니다. 앞으로도 ZKML은 AI 발전을 점진적으로 따라잡을 기회가 있을 수 있지만, 격차를 좁히려면 지속적인 기술 혁신과 최적화가 필요합니다. 이는 ZKML이 현재 web3 애플리케이션에 기술적인 병목 현상이 있음에도 불구하고 영지식 증명 기술의 지속적인 개발로 인해 앞으로도 ZKML이 web3 시나리오에서 더 큰 역할을 할 것으로 기대할 이유가 있음을 의미합니다. 최첨단 ML과 ZK의 개선율을 비교해 보면 전망은 그다지 낙관적이지 않습니다. 그러나 컨볼루션 성능, ZK 하드웨어 및 고도로 구조화된 신경망 작업을 기반으로 맞춤화된 ZK 증명 시스템의 지속적인 개선으로 인해 ZKML의 개발은 일부 구식 기계 제공을 시작으로 web3의 요구를 충족할 수 있을 것으로 기대됩니다. 학습 기능이 시작됩니다.
ChatGPT가 나에게 피드백하는 정보가 신뢰할 수 있는지 확인하기 위해 블록체인 + ZK를 사용하는 것은 어려울 수 있지만 일부 더 작고 오래된 ML 모델을 ZK 회로에 적용할 수는 있습니다.
결론적으로
"권력은 부패하기 쉽고, 절대 권력은 절대 부패한다". AI와 ML의 엄청난 힘으로 인해 현재 이를 거버넌스에 적용할 수 있는 확실한 방법은 없습니다. 정부가 여파에 대해 늦게 개입하거나 전면적인 금지 조치를 취한다는 사실은 여러 번 입증되었습니다. 블록체인+ZK는 증명 가능하고 검증 가능한 방식으로 괴물을 길들일 수 있는 몇 안 되는 솔루션 중 하나를 제공합니다.
ZKML 분야에서 더 많은 제품 혁신을 기대합니다. ZK와 블록체인은 AI/ML 운영을 위한 안전하고 신뢰할 수 있는 환경을 제공합니다. 또한 우리는 이러한 제품 혁신이 완전히 새로운 비즈니스 모델을 창출할 것으로 기대합니다. 왜냐하면 허가 없는 암호화폐 세계에서 우리는 여기서 de-SaaS 상용화 모델에 의해 제한되지 않기 때문입니다. 우리는 이 분야에서 더 많은 빌더를 지원할 수 있기를 기대합니다."서부 몰락지대의 무정부 상태"그리고"아이보리 타워 엘리트"그들의 흥미진진한 아이디어를 바탕으로 흥미로운 중복이 이루어졌습니다. 우리는 아직 초기 단계에 있지만 이미 세상을 구하는 길에 들어서 있는지도 모릅니다.
이 기사는 SevenX 연구팀이 작성한 원본이며 커뮤니케이션 및 학습 목적으로만 작성되었으며 투자 참고 자료가 아닙니다. 인용이 필요하신 경우 출처를 표기해주세요.