Volver al blog
Clasificación y Metodología

Cómo Limpiar Datasets Cripto Antes de Declarar: Guía de Ingeniería de Datos Fiscal 2025

Guía profesional para limpiar, depurar y preparar tus datos de criptomonedas antes de la declaración fiscal. Aprende técnicas de ingeniería de datos aplicadas a la fiscalidad crypto para obtener informes precisos ante la AEAT.

E

Equipo Cleriontax

Expertos en Fiscalidad Crypto y Análisis de Datos

10 min de lectura
Ingeniería de DatosLimpieza de DatosLimpieza de DatosCSVNormalizaciónDuplicadosFIFOAEATDeclaración RentaModelo 100ETLDatasetsConsolidaciónTrazabilidad
Cómo limpiar datasets de criptomonedas antes de declarar - Guía de ingeniería de datos fiscal para preparar CSV y calcular correctamente FIFO ante la AEAT
7 de diciembre de 2025
10 min de lectura
Clasificación y Metodología
Ingeniería de DatosLimpieza de DatosLimpieza de DatosCSVNormalizaciónDuplicadosFIFOAEATDeclaración RentaModelo 100ETLDatasetsConsolidaciónTrazabilidad

La diferencia entre una declaración fiscal de criptomonedas correcta y una que genere problemas con Hacienda no está únicamente en conocer la normativa. En la práctica, el verdadero desafío reside en la calidad de los datos que utilizas para calcular tus ganancias y pérdidas patrimoniales. Después de exportar tu historial de diferentes exchanges y wallets, te encuentras con un conjunto de archivos CSV que, en su estado original, contienen inconsistencias, duplicados, campos vacíos y formatos incompatibles que harán imposible calcular correctamente el método FIFO obligatorio en España.

En Cleriontax aplicamos metodologías de ingeniería de datos a cada informe fiscal que preparamos, porque sabemos que un dataset sucio produce resultados erróneos independientemente de lo buena que sea la herramienta de cálculo. Este artículo te enseñará a preparar tus datos como lo hacemos nosotros, aplicando técnicas profesionales de limpieza y normalización que garantizan la precisión de tu declaración ante la AEAT.

Por qué la limpieza de datos es crítica para tu declaración fiscal

Cuando exportas el historial de operaciones desde Binance, Coinbase, Kraken o cualquier exchange, obtienes archivos CSV que fueron diseñados para uso interno de cada plataforma, no para cumplimiento fiscal. Cada exchange utiliza su propio formato, sus propias denominaciones para los tipos de operación y sus propios criterios para registrar las transacciones. Si además tienes actividad en wallets como Metamask y has exportado datos desde exploradores de blockchain, la heterogeneidad de formatos se multiplica exponencialmente.

El problema fundamental es que la AEAT requiere datos precisos, cronológicamente ordenados y expresados en euros para aplicar el método FIFO correctamente. Un solo duplicado en tus datos puede distorsionar completamente el coste de adquisición de tus criptomonedas, generando ganancias o pérdidas patrimoniales incorrectas.

Errores más frecuentes en datasets sin procesar

Tipo de errorConsecuencia fiscalFrecuencia
Transacciones duplicadasDoble contabilización, FIFO incorrectoMuy alta
Fechas en formatos incompatiblesAño fiscal erróneo, ordenación incorrectaAlta
Operaciones internas mal clasificadasGanancias patrimoniales ficticiasAlta
Valores sin convertir a EURCálculos en monedas mixtasMedia
Campos vacíos o nulosErrores en fórmulas y cálculosMedia
Nomenclaturas diferentes para mismo conceptoClasificación fiscal incorrectaAlta

Cada uno de estos problemas, si no se corrige antes de calcular las ganancias patrimoniales, puede derivar en una declaración incorrecta con las consiguientes sanciones de la Agencia Tributaria.

Fase 1: Inventario y auditoría inicial de fuentes de datos

Antes de modificar cualquier archivo, es imprescindible realizar un inventario completo de todas las fuentes de datos que necesitas consolidar. Esta fase de auditoría inicial determina el alcance del trabajo de limpieza y permite identificar posibles gaps de información.

Comienza creando una lista exhaustiva de todos los exchanges donde has operado durante el año fiscal, incluyendo plataformas que hayas dejado de usar pero donde realizaste operaciones en el período a declarar. Para cada exchange, identifica qué tipos de exportación has realizado siguiendo las guías específicas de cada plataforma. Si no has completado la exportación de algún exchange, te recomendamos consultar nuestra guía para exportar el historial de Binance correctamente como referencia metodológica.

Checklist de inventario de fuentes

Exchanges centralizados:

  • Identificar todas las plataformas utilizadas (activas e inactivas)
  • Verificar que se han exportado todos los tipos de historial (trades, staking, earn, conversiones)
  • Documentar el rango de fechas de cada exportación
  • Anotar el formato de cada archivo (CSV, XLSX, JSON)

Wallets no custodiales:

  • Listar todas las direcciones de wallet utilizadas
  • Identificar las redes blockchain donde cada wallet tiene actividad
  • Verificar exportaciones de Etherscan, Polygonscan, etc.
  • Incluir tanto transacciones como transferencias de tokens

Estructura de carpetas recomendada:

📁 Datos_Fiscales_2024/
├── 📁 01_Originales_Intactos/
│   ├── 📁 Binance/
│   ├── 📁 Coinbase/
│   ├── 📁 Metamask_ETH/
│   └── 📁 Metamask_Polygon/
├── 📁 02_En_Proceso/
└── 📁 03_Consolidado_Final/

Mantener siempre una copia intacta de los archivos exportados antes de realizar cualquier modificación es fundamental tanto para auditorías internas como para posibles requerimientos de la AEAT donde debas demostrar la trazabilidad de tus cálculos.

Fase 2: Normalización de formatos de fecha y hora

Los formatos de fecha representan uno de los problemas más frecuentes y potencialmente graves en datasets de criptomonedas. Cada exchange utiliza su propio formato, y las diferencias pueden parecer sutiles pero tienen consecuencias significativas para el cálculo fiscal.

Formatos de fecha por plataforma

PlataformaFormato originalEjemploZona horaria
BinanceYYYY-MM-DD HH:MM:SS2024-06-15 14:32:18UTC
CoinbaseISO 86012024-06-15T14:32:18ZUTC
KrakenUnix timestamp1718458338UTC
EtherscanUnix timestamp1718458338UTC
BitstampDD/MM/YYYY HH:MM15/06/2024 14:32CET

Cuando estos archivos se combinan sin normalización, una ordenación cronológica puede producir resultados completamente incorrectos porque el software interpreta los campos de manera diferente.

Protocolo de normalización de fechas

El proceso debe seguir estos pasos en orden estricto:

  1. Identificar el formato de cada archivo fuente y documentarlo explícitamente
  2. Convertir todos los formatos a ISO 8601 (YYYY-MM-DDTHH:MM:SS) por su ordenabilidad natural
  3. Ajustar zona horaria a España (CET/CEST según la fecha)
  4. Verificar la conversión comparando fechas conocidas con el registro original

Ejemplo crítico de zona horaria:

Una transacción en Etherscan: 2024-12-31 23:30:00 UTC

Convertida a España (horario invierno): 2025-01-01 00:30:00 CET

Año fiscal: 2025, no 2024

Esta diferencia determina en qué ejercicio fiscal debe declararse la operación, lo cual puede tener implicaciones significativas si se trata de una ganancia o pérdida patrimonial relevante.

Fase 3: Detección y eliminación de duplicados

La duplicación de transacciones es el error más común y uno de los más perjudiciales en datasets de criptomonedas. Se produce principalmente por exportaciones con rangos de fechas solapados y operaciones que aparecen registradas de múltiples formas en diferentes tipos de exportación del mismo exchange.

Para detectar duplicados correctamente, no basta con comparar filas idénticas. Debes implementar una lógica de identificación basada en campos clave que definan la unicidad de cada transacción.

Campos clave para identificar duplicados

En exchanges centralizados:

  • Fecha y hora exacta (hasta segundos)
  • Par de trading (BTC/EUR, ETH/USDT...)
  • Tipo de operación (buy, sell, trade)
  • Cantidad ejecutada
  • Precio de ejecución

En transacciones blockchain:

  • Hash de transacción (txHash) → identificador único definitivo
  • Si no hay hash: combinación de bloque + from + to + value

Proceso de deduplicación en tres pasadas

PasadaCriterioAcción
PrimeraFilas 100% idénticasEliminar automáticamente
SegundaCampos clave coinciden, columnas secundarias difierenEliminar conservando más información
TerceraTransacciones similares no idénticasRevisión manual caso por caso

Ejemplo de duplicado sutil:

Fila 1: 2024-06-15 14:32:18 | BTC/EUR | BUY | 0.05 | 62450.00 | fee: 0.0001
Fila 2: 2024-06-15 14:32:18 | BTC/EUR | BUY | 0.05 | 62450.00 | fee: (vacío)

Ambas representan la misma operación, pero una tiene el fee y otra no. La pasada 2 debe conservar la fila 1.

Mantén un registro de todos los duplicados eliminados. Este registro sirve como documentación del proceso de limpieza y permite verificar que no se han eliminado operaciones legítimas por error. Si trabajas con herramientas de análisis como las que describimos en nuestra guía de herramientas para rastrear criptomonedas, muchas incluyen funciones de detección de duplicados que puedes utilizar como verificación cruzada.

Fase 4: Clasificación y estandarización de tipos de operación

Cada exchange utiliza su propia terminología para describir los tipos de operación. Lo que Binance llama "SPOT Trade" puede aparecer como "Trade" en Coinbase, "Exchange" en Kraken o simplemente "Buy" en otras plataformas. Para aplicar correctamente el tratamiento fiscal a cada operación, necesitas un sistema de clasificación estandarizado.

Tabla de mapeo: denominaciones originales → categoría fiscal

Denominación originalExchangeCategoría fiscal estandarizada
SPOT Trade, Trade, ExchangeVariosPermuta / Ganancia patrimonial
Buy, Purchase, CompraVariosAdquisición
Sell, VentaVariosEnajenación / Ganancia patrimonial
Convert, Conversion, SwapVariosPermuta / Ganancia patrimonial
Deposit, IngresoVariosMovimiento interno (verificar origen)
Withdrawal, RetiroVariosMovimiento interno (verificar destino)
Staking Reward, InterestVariosRendimiento capital mobiliario
Airdrop, DistributionVariosRendimiento capital (valorar a mercado)
Fee, Commission, GasVariosGasto deducible

Categorías fiscales principales

La correcta clasificación de cada operación determina su tratamiento fiscal:

  • Ganancias/pérdidas patrimoniales: Ventas, permutas entre criptos, pagos con crypto
  • Rendimientos del capital mobiliario: Staking, lending, farming, airdrops
  • Movimientos internos: Transferencias entre wallets propias (no tributan)
  • Gastos deducibles: Comisiones, gas fees, fees de trading

Un error frecuente es clasificar transferencias entre wallets propias como ventas, lo que genera ganancias patrimoniales ficticias. Para profundizar en los criterios de clasificación según la AEAT, te recomendamos consultar nuestro artículo sobre cómo clasificar operaciones de criptomonedas.

Fase 5: Conversión de valores a euros

La AEAT requiere que todas las operaciones se declaren en euros, valoradas al tipo de cambio del momento exacto de cada transacción. Este requisito implica un proceso de conversión que debe realizarse con precisión y con fuentes de cotización documentadas.

Fuentes de cotización recomendadas

Tipo de activoFuente primariaFuente alternativaGranularidad
BTC, ETH, top 20CoinGecko APICoinMarketCapMinutos
Altcoins líquidasCoinGecko APIExchange donde se operóHoras
Tokens ilíquidosPrecio en exchangeDEX (Uniswap, etc.)Transacción
Stablecoins USDTipo cambio EUR/USDBCE o OANDADiario

Proceso de conversión para operaciones crypto-crypto

Para operaciones realizadas en pares cripto-cripto, necesitas una conversión en dos pasos:

Ejemplo: Swap ETH → LINK en Uniswap

1. Operación original:
   - Enviado: 2 ETH
   - Recibido: 150 LINK
   - Fecha: 2024-07-20 15:45:00 UTC

2. Paso 1 - Valorar ETH en EUR:
   - Precio ETH el 20/07/2024 15:45: 3.200 €
   - Valor enviado: 2 × 3.200 = 6.400 €

3. Paso 2 - Valorar LINK en EUR:
   - Precio LINK el 20/07/2024 15:45: 42,50 €
   - Valor recibido: 150 × 42,50 = 6.375 €

4. Resultado fiscal:
   - Valor transmisión: 6.375 € (lo que recibes)
   - Si coste adquisición ETH era 5.000 €:
   - Ganancia patrimonial: 6.375 - 5.000 = 1.375 €

El proceso debe documentar la fuente de cada cotización utilizada. Esto es especialmente importante para operaciones de alto valor donde una diferencia de cotización puede suponer miles de euros de diferencia en la ganancia patrimonial calculada.

En Cleriontax utilizamos bases de datos propias de cotizaciones históricas validadas que nos permiten aplicar conversiones precisas incluso para tokens poco líquidos.

Fase 6: Tratamiento de campos vacíos y valores anómalos

Los campos vacíos y los valores anómalos en datasets de criptomonedas pueden tener múltiples causas legítimas, pero también pueden indicar problemas de exportación que requieren corrección. El tratamiento de estos casos debe ser cuidadoso para no eliminar información válida ni propagar errores.

Interpretación de campos vacíos

Campo vacíoInterpretación probableAcción
Fee / ComisiónPromoción sin fee o fee en otro tokenVerificar, si correcto → 0
PrecioError de exportación graveConsultar historial original
CantidadError de exportación graveConsultar historial original
Hash transacciónNormal en exchanges centralizadosAceptable
Notas / MemoCampo opcional no utilizadoIgnorar

Detección de valores anómalos

Implementa validaciones automáticas que marquen valores sospechosos:

  • Precio implícito ±20% vs mercado: Flag para revisión manual
  • Cantidades negativas: Error de signo, corregir
  • Fechas fuera de rango: Exportación corrupta, re-exportar
  • Fees superiores al 10% del valor: Verificar (puede ser legítimo en redes congestionadas)

Ejemplo de anomalía legítima:

Operación: Swap 0.01 ETH → 50 USDC
Fecha: 2024-05-15 (congestión red por memecoin)
Gas fee: 0.008 ETH (80% del valor operado)

→ Parece anómalo pero es correcto. Documentar y conservar.

Cada anomalía debe investigarse individualmente para determinar si representa un error que debe corregirse o una operación atípica pero legítima.

Fase 7: Consolidación de múltiples fuentes

Una vez que cada archivo fuente ha sido normalizado individualmente, el siguiente paso es consolidar todos los datos en un dataset único que represente la totalidad de tu actividad en criptomonedas durante el período fiscal.

Esquema de columnas unificado

ColumnaTipoObligatoriaDescripción
fecha_horadatetimeISO 8601, zona horaria España
tipo_operacionstringCategoría fiscal estandarizada
cripto_enviadastringSegún tipoSímbolo del activo vendido/enviado
cantidad_enviadadecimalSegún tipoCantidad del activo enviado
cripto_recibidastringSegún tipoSímbolo del activo comprado/recibido
cantidad_recibidadecimalSegún tipoCantidad del activo recibido
valor_eurdecimalValor de la operación en EUR
fee_eurdecimalComisión total en EUR
fuentestringExchange/wallet de origen
hash_txstringNoHash de blockchain si aplica
notasstringNoObservaciones del proceso

Proceso de consolidación

  1. Añadir columna de origen a cada registro antes de combinar
  2. Unificar nombres de columnas según el esquema estándar
  3. Combinar todos los archivos en un único dataset
  4. Ordenar cronológicamente por fecha_hora
  5. Ejecutar deduplicación final por si hay operaciones cruzadas

Si la consolidación y el cálculo FIFO te resultan complejos, nuestro servicio de análisis de carteras incluye todo el proceso de limpieza, normalización y cálculo con verificación profesional de cada paso.

Fase 8: Validación cruzada y verificación de integridad

Antes de utilizar el dataset limpio para calcular tu declaración fiscal, es imprescindible realizar una validación cruzada que verifique la integridad de los datos procesados.

Tres verificaciones obligatorias

1. Balance de control

Calcula el saldo final de cada criptomoneda según tu dataset y compáralo con el saldo real:

Saldo según dataset BTC: 0.5423 BTC
Saldo real en exchanges + wallets: 0.5420 BTC
Diferencia: 0.0003 BTC (0.05%)

→ Diferencia aceptable por redondeos

Diferencias superiores al 1% requieren investigación.

2. Conteo de operaciones

Registros originales totales: 2.847
Duplicados eliminados (documentados): 156
Registros en dataset final: 2.691

2.847 - 156 = 2.691 ✓ Cuadra

3. Coherencia temporal

Revisa que no existan gaps temporales inexplicados. Si operaste activamente todo el año pero tu dataset muestra meses sin actividad, puede indicar exportaciones incompletas.

Esta fase de validación es donde un servicio profesional de liquidaciones fiscales aporta mayor valor, ya que la experiencia permite identificar patrones de error que un usuario ocasional podría pasar por alto.

Herramientas para automatizar la limpieza

Para usuarios con volúmenes elevados de transacciones, el procesamiento manual puede resultar impracticable. Estas herramientas ayudan a automatizar parte del proceso:

Comparativa de herramientas

HerramientaVolumen recomendadoNivel técnicoCoste
Excel / Google Sheets< 2.000 txBásicoGratuito
Google Sheets + QUERY< 5.000 txIntermedioGratuito
Python + pandasIlimitadoAvanzadoGratuito
Koinly / CoinTracking< 10.000 txBásicoDe pago

Para Excel/Sheets:

  • Función ELIMINAR.DUPLICADOS para pasada 1
  • Tablas dinámicas para verificación de totales
  • BUSCARV / VLOOKUP para añadir cotizaciones
  • Formato condicional para detectar anomalías

Para usuarios técnicos (Python):

import pandas as pd

# Cargar y combinar fuentes
df = pd.concat([binance_df, coinbase_df, etherscan_df])

# Normalizar fechas
df['fecha'] = pd.to_datetime(df['fecha'], utc=True)
df['fecha'] = df['fecha'].dt.tz_convert('Europe/Madrid')

# Eliminar duplicados por campos clave
df = df.drop_duplicates(subset=['fecha', 'par', 'tipo', 'cantidad'])

# Ordenar cronológicamente
df = df.sort_values('fecha')

Las herramientas de fiscalidad crypto como Koinly incluyen funciones de limpieza integradas, pero aplican sus propios criterios que pueden no coincidir exactamente con los requisitos de la AEAT. Recomendamos utilizarlas como complemento para verificación cruzada.

Documentación del proceso de limpieza

Cada decisión tomada durante el proceso de limpieza debe quedar documentada. Esta documentación sirve para reproducir el proceso si necesitas recalcular, proporciona evidencia ante posibles requerimientos de la AEAT, y facilita la revisión por terceros.

Contenido del documento de metodología

  • Inventario completo de fuentes con fechas de exportación
  • Criterios de normalización aplicados a cada tipo de campo
  • Tabla de mapeo de tipos de operación
  • Fuentes de cotización utilizadas para conversión a EUR
  • Registro de duplicados eliminados con justificación
  • Anomalías detectadas y su tratamiento
  • Resultados de las verificaciones de integridad

Conserva también todos los archivos intermedios del proceso, no solo los originales y el resultado final. Si posteriormente detectas un error, los archivos intermedios permiten identificar en qué fase se introdujo.

En nuestros servicios de seguimiento de cartera, incluimos documentación completa del proceso de análisis que entregamos junto con el informe fiscal, garantizando trazabilidad total.

Errores críticos que debes evitar

Existen errores en el proceso de limpieza con consecuencias especialmente graves:

1. Eliminar operaciones legítimas como "duplicados"

En trading activo es frecuente ejecutar múltiples operaciones del mismo par en intervalos cortos. Verifica que las transacciones sean verdaderamente idénticas antes de eliminarlas.

2. Conversiones de moneda incorrectas

Dividir cuando debías multiplicar, o usar el tipo de cambio inverso, genera valores absurdos que pueden pasar desapercibidos sin verificaciones de balance.

3. Ignorar las comisiones

Las fees son gastos deducibles que reducen tu ganancia patrimonial. Un dataset donde las comisiones se han perdido produce una declaración que paga más impuestos de los debidos.

4. Clasificar movimientos internos como ventas

Los movimientos entre tus propios exchanges y wallets no generan tributación. Si se clasifican como ventas, producen ganancias patrimoniales ficticias que no deberías pagar.

Si no tienes seguridad en algún aspecto del proceso, nuestro equipo de asesoría fiscal especializada en criptomonedas puede revisar tu trabajo y detectar problemas antes de que afecten tu declaración.

Conclusión: datos limpios, declaración correcta

La limpieza de datasets de criptomonedas no es un paso opcional ni una mejora cosmética. Es un requisito fundamental para obtener una declaración fiscal precisa que cumpla con los requisitos de la AEAT y que puedas defender ante un posible requerimiento. Un dataset sucio producirá resultados incorrectos independientemente de la calidad del software o la metodología de cálculo que utilices posteriormente.

El proceso completo requiere tiempo, atención al detalle y conocimiento tanto de la operativa de criptomonedas como de los requisitos fiscales españoles. Para usuarios con operativa simple y pocas transacciones, seguir esta guía debería ser suficiente. Para operativas complejas con múltiples exchanges, actividad DeFi significativa o miles de transacciones, la asistencia profesional puede ahorrar tiempo y evitar errores costosos.

En Cleriontax combinamos experiencia en fiscalidad de criptomonedas con metodologías rigurosas de ingeniería de datos para garantizar que cada informe que preparamos se basa en datos verificados y trazables. Si prefieres delegar este proceso técnico, nuestros servicios especializados están diseñados exactamente para eso.

Tu próximo paso: Si ya has exportado tus datos y necesitas ayuda con la limpieza, consolidación o cálculo fiscal, contacta con nuestro equipo para una evaluación inicial sin compromiso. Si todavía estás en fase de exportación, visita nuestro blog donde encontrarás guías específicas para cada exchange y wallet.

Descargo de responsabilidad: Este artículo tiene finalidad informativa y educativa. No constituye asesoramiento fiscal personalizado. La normativa fiscal está sujeta a cambios y cada situación personal es única. Consulta siempre con un asesor fiscal profesional antes de tomar decisiones fiscales.

Última actualización: Diciembre 2025

Publicado por: Equipo Cleriontax - Expertos en Fiscalidad Crypto y Análisis de Datos

¿Te ha resultado útil este artículo?

Compártelo con otros inversores que puedan necesitarlo

Artículos relacionados

Continúa aprendiendo sobre fiscalidad de criptomonedas

LP Tokens y Liquidity Pools - Guía fiscal completa sobre cómo tributan los pools de liquidez y los tokens LP ante la AEAT en España
DeFi y Protocolos Avanzados
Destacado
15 min

LP Tokens al Descubierto: Cómo Tributan los Pools de Liquidez en España

Depositar en un pool de liquidez genera más obligaciones fiscales de las que imaginas: permutas al entrar, rendimientos mientras permaneces, y nuevas ganancias al salir. Descubre el ciclo fiscal completo de los LP tokens y evita errores que pueden costarte miles de euros ante la AEAT.

Liquidity PoolsLP TokensFiscalidad DeFi Avanzada+13
E

Equipo Cleriontax

Expertos en Fiscalidad Crypto y Análisis de Datos

Leer más
Yield Farming y fiscalidad en España - Guía completa sobre cómo tributan los rendimientos de farming DeFi ante la AEAT
DeFi y Protocolos Avanzados
Destacado
14 min

Yield Farming en España: Guía Fiscal Completa sobre Cómo Tributan los Rendimientos DeFi

El yield farming genera rendimientos atractivos, pero su tributación en España es compleja: rewards, tokens LP, impermanent loss y múltiples protocolos. Descubre exactamente cómo declarar cada tipo de ganancia ante la AEAT y evita sanciones que pueden superar el 150%.

Yield FarmingFiscalidad DeFi AvanzadaFarmeo Criptomonedas+12
E

Equipo Cleriontax

Expertos en Fiscalidad Crypto y Análisis de Datos

Leer más

¿Necesitas ayuda con tu declaración de criptomonedas?

Nuestro equipo de expertos puede analizar tu caso y preparar tu declaración fiscal completa

Solicitar análisis gratuito