Historia de la evolución del índice de datos de la cadena de bloques: del nodo a los servicios de toda la cadena impulsados por inteligencia artificial
Evolución de la tecnología de indexación de datos de la cadena de bloques: de nodos a servicios de cadena completa impulsados por IA
1. Introducción
Desde la aparición de la primera tanda de aplicaciones de cadena de bloques en 2017, hasta hoy en día, donde florecen todo tipo de aplicaciones financieras, de juegos y sociales basadas en diferentes cadenas de bloques, ¿hemos pensado alguna vez en las diversas fuentes de datos que estas aplicaciones utilizan en sus interacciones?
En 2024, la inteligencia artificial y Web3 se convierten en temas candentes. En el campo de la IA, los datos son la base de su desarrollo. Así como las plantas necesitan luz solar y agua, los sistemas de IA también dependen de grandes volúmenes de datos para seguir aprendiendo y evolucionando. Sin datos, incluso los algoritmos de IA más sofisticados tienen dificultades para mostrar la inteligencia y eficacia que deberían.
Este artículo explorará en profundidad la evolución de la accesibilidad de los datos en la cadena de bloques, analizará la evolución del índice de datos en la industria y comparará las similitudes y diferencias en las características técnicas entre los antiguos protocolos de índice y los nuevos protocolos de servicios de datos.
2. La evolución del índice de datos: de nodos de cadena de bloques a bases de datos de cadena completa
2.1 Fuente de datos: Nodo de la cadena de bloques
La cadena de bloques es un libro de contabilidad descentralizado, el nodo es la base de toda la red, encargado de registrar, almacenar y difundir todos los datos de transacciones. Cada nodo tiene una copia completa de los datos de la cadena de bloques, manteniendo la característica de descentralización de la red. Sin embargo, no es fácil para los usuarios comunes construir y mantener un nodo, no solo se necesita técnica profesional, sino también altos costos de hardware y ancho de banda. La capacidad de consulta de los nodos comunes también es limitada, lo que dificulta satisfacer las necesidades de los desarrolladores. Por lo tanto, los usuarios a menudo dependen de servicios de terceros.
Los proveedores de nodos RPC han surgido, encargándose de la gestión de nodos y proporcionando datos a través de puntos finales RPC. Esto permite a los usuarios acceder a los datos de la cadena de bloques sin tener que construir sus propios nodos. Los puntos finales RPC públicos son gratuitos pero tienen limitaciones de velocidad, mientras que los puntos finales RPC privados ofrecen un mejor rendimiento pero su eficiencia sigue siendo baja. A pesar de esto, la interfaz API estandarizada de los proveedores de nodos ha reducido la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para la posterior解析 y aplicación de datos.
2.2 Análisis de datos: de datos en bruto a datos utilizables
Los datos originales proporcionados por los nodos de la cadena de bloques suelen ser procesados mediante cifrado y codificación, garantizando la integridad y la seguridad, pero también aumentando la dificultad de análisis. Para los usuarios comunes y los desarrolladores, manejar estos datos directamente requiere una gran cantidad de conocimientos técnicos y recursos computacionales.
El proceso de análisis de datos se vuelve, por lo tanto, crucial. Al convertir datos brutos complejos en un formato que sea fácil de entender y manipular, los usuarios pueden aprovechar estos datos de una manera más intuitiva. La calidad del análisis afecta directamente la eficiencia y efectividad de las aplicaciones de datos de cadena de bloques, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 La evolución del indexador de datos
A medida que aumenta la cantidad de datos en la cadena de bloques, la demanda de indexadores también crece. Los indexadores desempeñan un papel importante en la organización de los datos en la cadena y en su envío a bases de datos para su consulta. Indexan los datos de la cadena de bloques y proporcionan una interfaz de lenguaje de consulta similar a SQL (, como la API de GraphQL ), para que los datos estén disponibles en todo momento. Esta interfaz de consulta unificada simplifica enormemente el proceso para que los desarrolladores recuperen la información necesaria.
Diferentes tipos de indexadores optimizan la recuperación de datos de diversas maneras:
Indexador de nodo completo: extrae datos directamente de nodos de cadena de bloques completos, asegurando que sean completos y precisos, pero requiere una gran capacidad de almacenamiento y procesamiento.
Indexador ligero: se basa en nodos completos para obtener datos específicos bajo demanda, reduciendo la necesidad de almacenamiento pero pudiendo aumentar el tiempo de consulta.
Indexador especializado: optimización de la recuperación para tipos específicos de datos o Cadena de bloques, como datos de NFT o transacciones de DeFi.
Agregador de índices: extrae datos de múltiples cadenas de bloques y fuentes, incluyendo información fuera de la cadena, y proporciona una interfaz de consulta unificada, adecuada para aplicaciones multichain.
Actualmente, los nodos de archivos de Ethereum ocupan entre 3 y 13.5 TB de espacio de almacenamiento en diferentes clientes. Ante tal cantidad de datos, los protocolos de indexación principales no solo soportan indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para diferentes necesidades de aplicación.
En comparación con los puntos finales RPC tradicionales, los indexadores mejoran significativamente la eficiencia de indexación y consulta de datos. Soportan consultas complejas, filtrado de datos y análisis posterior a la extracción. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadenas de bloques, evitando el problema de que las aplicaciones multichain necesiten desplegar múltiples API. A través de la ejecución distribuida, los indexadores ofrecen una mayor seguridad y rendimiento, reduciendo los riesgos que pueden surgir de proveedores RPC centralizados.
2.4 Base de datos de cadena completa: alineación prioritaria de flujo
A medida que las demandas de las aplicaciones se vuelven más complejas, los índices de datos de nivel básico son difíciles de satisfacer con las crecientes y diversas necesidades de consulta, como la búsqueda, el acceso entre cadenas o el mapeo de datos fuera de la cadena. En la arquitectura moderna de tuberías de datos, el enfoque "prioridad de flujo" se ha convertido en una solución para superar las limitaciones del procesamiento por lotes tradicional, logrando el procesamiento y análisis de datos en tiempo real.
Los proveedores de servicios de datos de cadena de bloques también están avanzando hacia la construcción de flujos de datos. Los proveedores de servicios de indexación tradicionales han lanzado productos de flujo de datos de cadena de bloques en tiempo real, como Substreams de The Graph y Mirror de Goldsky. También existen lagos de datos en tiempo real generados a partir de la cadena de bloques, como Chainbase y SubSquid.
Estos servicios están destinados a abordar la necesidad de análisis en tiempo real de transacciones de la cadena de bloques y proporcionar una capacidad de consulta más integral. Al redefinir la gestión de datos en la cadena desde la perspectiva de los modernos canales de datos, podemos imaginar un futuro con conjuntos de datos de alto rendimiento personalizados para cualquier caso de uso empresarial.
3. IA + Base de datos: Comparación entre The Graph, Chainbase y Space and Time
3.1 The Graph
La red The Graph proporciona servicios de indexación y consulta de datos multichain a través de nodos descentralizados. Sus principales modos de producto incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, atendiendo las necesidades de consulta de productos de los usuarios.
Subgráficos ( son la estructura de datos básica de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. La red está compuesta por cuatro roles: indexadores, curadores, delegadores y desarrolladores, que apoyan conjuntamente las necesidades de datos de las aplicaciones web3.
Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. AutoAgora, Allocation Optimizer y AgentC, desarrollados por Semiotic Labs, optimizan respectivamente las estrategias de precios, la asignación de recursos y la experiencia del usuario, mejorando la inteligencia del sistema y la amigabilidad para el usuario.
![Lectura, índice a análisis, descripción breve de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de bloques en una plataforma. Sus características incluyen:
Lago de datos en tiempo real: proporciona un lago de datos en tiempo real dedicado al flujo de datos de la cadena de bloques.
Arquitectura de doble cadena: construida sobre la capa de ejecución de Eigenlayer AVS, formando una arquitectura paralela con el algoritmo de consenso CometBFT.
Estándar de formato de datos innovador: introducción del estándar de formato de datos "manuscripts".
Modelo del mundo criptográfico: combinar la tecnología de IA para crear un modelo que pueda entender y predecir las transacciones de la cadena de bloques.
El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, analiza los datos externos en la cadena y las actividades temporales y espaciales, proporcionando servicios de datos inteligentes a los usuarios.
![Lectura, indexación y análisis, resumen de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espacio y Tiempo
Space and Time ###SxT( se dedica a construir una capa de computación verificable, ampliando las pruebas de conocimiento cero sobre un almacén de datos descentralizado. Su tecnología central Proof of SQL garantiza la inmutabilidad y verificabilidad de las consultas SQL, ofreciendo una solución eficiente para la validación de datos.
SxT colabora con el laboratorio de innovación de IA de Microsoft para desarrollar herramientas de IA generativa que permiten a los usuarios procesar datos de la cadena de bloques a través del procesamiento del lenguaje natural. En Space and Time Studio, la IA puede convertir el lenguaje natural en SQL y ejecutar consultas.
![Leer, indexar para analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusión y perspectivas
La tecnología de índice de datos de la cadena de bloques ha evolucionado desde las fuentes de datos de nodos iniciales, pasando por el desarrollo de la解析 y el indexador, hasta llegar a un servicio de datos de toda la cadena potenciado por IA, experimentando un proceso de mejora gradual. Estos avances tecnológicos no solo han aumentado la eficiencia y precisión del acceso a los datos, sino que también han brindado una experiencia inteligente.
En el futuro, con el desarrollo de nuevas tecnologías como la IA y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de la cadena de bloques seguirán apoyando la innovación en la industria.
![Leer, indexar y analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
14 me gusta
Recompensa
14
5
Compartir
Comentar
0/400
ChainSpy
· hace6h
Simplemente indexa todos los datos de la cadena y ya está~
Ver originalesResponder0
ProbablyNothing
· hace16h
Prueba a jugar.
Ver originalesResponder0
FUD_Whisperer
· hace16h
alcista啊索引器走上智能化
Ver originalesResponder0
BearMarketNoodler
· hace16h
No hay nada nuevo. Esta trampa se usó en 2008.
Ver originalesResponder0
HorizonHunter
· hace16h
La IA es muy poderosa, pero no puede hacerse técnica de manera aburrida.
Historia de la evolución del índice de datos de la cadena de bloques: del nodo a los servicios de toda la cadena impulsados por inteligencia artificial
Evolución de la tecnología de indexación de datos de la cadena de bloques: de nodos a servicios de cadena completa impulsados por IA
1. Introducción
Desde la aparición de la primera tanda de aplicaciones de cadena de bloques en 2017, hasta hoy en día, donde florecen todo tipo de aplicaciones financieras, de juegos y sociales basadas en diferentes cadenas de bloques, ¿hemos pensado alguna vez en las diversas fuentes de datos que estas aplicaciones utilizan en sus interacciones?
En 2024, la inteligencia artificial y Web3 se convierten en temas candentes. En el campo de la IA, los datos son la base de su desarrollo. Así como las plantas necesitan luz solar y agua, los sistemas de IA también dependen de grandes volúmenes de datos para seguir aprendiendo y evolucionando. Sin datos, incluso los algoritmos de IA más sofisticados tienen dificultades para mostrar la inteligencia y eficacia que deberían.
Este artículo explorará en profundidad la evolución de la accesibilidad de los datos en la cadena de bloques, analizará la evolución del índice de datos en la industria y comparará las similitudes y diferencias en las características técnicas entre los antiguos protocolos de índice y los nuevos protocolos de servicios de datos.
2. La evolución del índice de datos: de nodos de cadena de bloques a bases de datos de cadena completa
2.1 Fuente de datos: Nodo de la cadena de bloques
La cadena de bloques es un libro de contabilidad descentralizado, el nodo es la base de toda la red, encargado de registrar, almacenar y difundir todos los datos de transacciones. Cada nodo tiene una copia completa de los datos de la cadena de bloques, manteniendo la característica de descentralización de la red. Sin embargo, no es fácil para los usuarios comunes construir y mantener un nodo, no solo se necesita técnica profesional, sino también altos costos de hardware y ancho de banda. La capacidad de consulta de los nodos comunes también es limitada, lo que dificulta satisfacer las necesidades de los desarrolladores. Por lo tanto, los usuarios a menudo dependen de servicios de terceros.
Los proveedores de nodos RPC han surgido, encargándose de la gestión de nodos y proporcionando datos a través de puntos finales RPC. Esto permite a los usuarios acceder a los datos de la cadena de bloques sin tener que construir sus propios nodos. Los puntos finales RPC públicos son gratuitos pero tienen limitaciones de velocidad, mientras que los puntos finales RPC privados ofrecen un mejor rendimiento pero su eficiencia sigue siendo baja. A pesar de esto, la interfaz API estandarizada de los proveedores de nodos ha reducido la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para la posterior解析 y aplicación de datos.
2.2 Análisis de datos: de datos en bruto a datos utilizables
Los datos originales proporcionados por los nodos de la cadena de bloques suelen ser procesados mediante cifrado y codificación, garantizando la integridad y la seguridad, pero también aumentando la dificultad de análisis. Para los usuarios comunes y los desarrolladores, manejar estos datos directamente requiere una gran cantidad de conocimientos técnicos y recursos computacionales.
El proceso de análisis de datos se vuelve, por lo tanto, crucial. Al convertir datos brutos complejos en un formato que sea fácil de entender y manipular, los usuarios pueden aprovechar estos datos de una manera más intuitiva. La calidad del análisis afecta directamente la eficiencia y efectividad de las aplicaciones de datos de cadena de bloques, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 La evolución del indexador de datos
A medida que aumenta la cantidad de datos en la cadena de bloques, la demanda de indexadores también crece. Los indexadores desempeñan un papel importante en la organización de los datos en la cadena y en su envío a bases de datos para su consulta. Indexan los datos de la cadena de bloques y proporcionan una interfaz de lenguaje de consulta similar a SQL (, como la API de GraphQL ), para que los datos estén disponibles en todo momento. Esta interfaz de consulta unificada simplifica enormemente el proceso para que los desarrolladores recuperen la información necesaria.
Diferentes tipos de indexadores optimizan la recuperación de datos de diversas maneras:
Actualmente, los nodos de archivos de Ethereum ocupan entre 3 y 13.5 TB de espacio de almacenamiento en diferentes clientes. Ante tal cantidad de datos, los protocolos de indexación principales no solo soportan indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para diferentes necesidades de aplicación.
En comparación con los puntos finales RPC tradicionales, los indexadores mejoran significativamente la eficiencia de indexación y consulta de datos. Soportan consultas complejas, filtrado de datos y análisis posterior a la extracción. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadenas de bloques, evitando el problema de que las aplicaciones multichain necesiten desplegar múltiples API. A través de la ejecución distribuida, los indexadores ofrecen una mayor seguridad y rendimiento, reduciendo los riesgos que pueden surgir de proveedores RPC centralizados.
2.4 Base de datos de cadena completa: alineación prioritaria de flujo
A medida que las demandas de las aplicaciones se vuelven más complejas, los índices de datos de nivel básico son difíciles de satisfacer con las crecientes y diversas necesidades de consulta, como la búsqueda, el acceso entre cadenas o el mapeo de datos fuera de la cadena. En la arquitectura moderna de tuberías de datos, el enfoque "prioridad de flujo" se ha convertido en una solución para superar las limitaciones del procesamiento por lotes tradicional, logrando el procesamiento y análisis de datos en tiempo real.
Los proveedores de servicios de datos de cadena de bloques también están avanzando hacia la construcción de flujos de datos. Los proveedores de servicios de indexación tradicionales han lanzado productos de flujo de datos de cadena de bloques en tiempo real, como Substreams de The Graph y Mirror de Goldsky. También existen lagos de datos en tiempo real generados a partir de la cadena de bloques, como Chainbase y SubSquid.
Estos servicios están destinados a abordar la necesidad de análisis en tiempo real de transacciones de la cadena de bloques y proporcionar una capacidad de consulta más integral. Al redefinir la gestión de datos en la cadena desde la perspectiva de los modernos canales de datos, podemos imaginar un futuro con conjuntos de datos de alto rendimiento personalizados para cualquier caso de uso empresarial.
3. IA + Base de datos: Comparación entre The Graph, Chainbase y Space and Time
3.1 The Graph
La red The Graph proporciona servicios de indexación y consulta de datos multichain a través de nodos descentralizados. Sus principales modos de producto incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, atendiendo las necesidades de consulta de productos de los usuarios.
Subgráficos ( son la estructura de datos básica de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. La red está compuesta por cuatro roles: indexadores, curadores, delegadores y desarrolladores, que apoyan conjuntamente las necesidades de datos de las aplicaciones web3.
Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. AutoAgora, Allocation Optimizer y AgentC, desarrollados por Semiotic Labs, optimizan respectivamente las estrategias de precios, la asignación de recursos y la experiencia del usuario, mejorando la inteligencia del sistema y la amigabilidad para el usuario.
![Lectura, índice a análisis, descripción breve de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de bloques en una plataforma. Sus características incluyen:
El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, analiza los datos externos en la cadena y las actividades temporales y espaciales, proporcionando servicios de datos inteligentes a los usuarios.
![Lectura, indexación y análisis, resumen de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espacio y Tiempo
Space and Time ###SxT( se dedica a construir una capa de computación verificable, ampliando las pruebas de conocimiento cero sobre un almacén de datos descentralizado. Su tecnología central Proof of SQL garantiza la inmutabilidad y verificabilidad de las consultas SQL, ofreciendo una solución eficiente para la validación de datos.
SxT colabora con el laboratorio de innovación de IA de Microsoft para desarrollar herramientas de IA generativa que permiten a los usuarios procesar datos de la cadena de bloques a través del procesamiento del lenguaje natural. En Space and Time Studio, la IA puede convertir el lenguaje natural en SQL y ejecutar consultas.
![Leer, indexar para analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusión y perspectivas
La tecnología de índice de datos de la cadena de bloques ha evolucionado desde las fuentes de datos de nodos iniciales, pasando por el desarrollo de la解析 y el indexador, hasta llegar a un servicio de datos de toda la cadena potenciado por IA, experimentando un proceso de mejora gradual. Estos avances tecnológicos no solo han aumentado la eficiencia y precisión del acceso a los datos, sino que también han brindado una experiencia inteligente.
En el futuro, con el desarrollo de nuevas tecnologías como la IA y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de la cadena de bloques seguirán apoyando la innovación en la industria.
![Leer, indexar y analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(