Com Netejar Datasets Cripto Abans de Declarar: Guia d'Enginyeria de Dades Fiscal 2025
Guia professional per netejar, depurar i preparar les teves dades de criptomonedes abans de la declaració fiscal. Aprèn tècniques d'enginyeria de dades aplicades a la fiscalitat cripto per obtenir informes precisos davant l'AEAT.
Equip Cleriontax
Experts en Fiscalitat Crypto i Anàlisi de Dades

La diferència entre una declaració fiscal de criptomonedes correcta i una que generi problemes amb Hisenda no rau únicament a conèixer la normativa. A la pràctica, el veritable repte està en la qualitat de les dades que utilitzes per calcular les teves guanys i pèrdues patrimonials. Després d'exportar el teu historial de diferents exchanges i wallets, et trobes amb un conjunt d'arxius CSV que, en el seu estat original, contenen inconsistències, duplicats, camps buits i formats incompatibles que faran impossible calcular correctament el mètode FIFO obligatori a Espanya.
A Cleriontax apliquem metodologies d'enginyeria de dades a cada informe fiscal que preparem, perquè sabem que un dataset brut produeix resultats erronis independentment de com sigui de bona l'eina de càlcul. Aquest article t'ensenyarà a preparar les teves dades com ho fem nosaltres, aplicant tècniques professionals de neteja i normalització que garanteixen la precisió de la teva declaració davant l'AEAT.
Per què la neteja de dades és crítica per a la teva declaració fiscal
Quan exportes l'historial d'operacions des de Binance, Coinbase, Kraken o qualsevol exchange, obtens arxius CSV que han estat dissenyats per a ús intern de cada plataforma, no per al compliment fiscal. Cada exchange utilitza el seu propi format, les seves pròpies denominacions per als tipus d'operació i els seus propis criteris per registrar les transaccions. Si, a més, tens activitat en wallets com Metamask i has exportat dades des d'exploradors de blockchain, l'heterogeneïtat de formats es multiplica exponencialment.
El problema fonamental és que l'AEAT requereix dades precises, ordenades cronològicament i expressades en euros per aplicar el mètode FIFO correctament. Un sol duplicat en les teves dades pot distorsionar completament el cost d'adquisició de les teves criptomonedes, generant guanys o pèrdues patrimonials incorrectes.
Errors més freqüents en datasets sense processar
| Tipus d'error | Conseqüència fiscal | Freqüència |
|---|---|---|
| Transaccions duplicades | Doble comptabilització, FIFO incorrecte | Molt alta |
| Dates en formats incompatibles | Any fiscal erroni, ordenació incorrecta | Alta |
| Operacions internes mal classificades | Guanys patrimonials ficticis | Alta |
| Valors sense convertir a EUR | Càlculs en monedes mixtes | Mitjana |
| Camps buits o nuls | Errors en fórmules i càlculs | Mitjana |
| Nomenclatures diferents per al mateix concepte | Classificació fiscal incorrecta | Alta |
Cadascun d'aquests problemes, si no es corregeix abans de calcular les guanys patrimonials, pot derivar en una declaració incorrecta amb les consegüents sancions de l'Agència Tributària.
Fase 1: Inventari i auditoria inicial de fonts de dades
Abans de modificar qualsevol arxiu, és imprescindible fer un inventari complet de totes les fonts de dades que necessites consolidar. Aquesta fase d'auditoria inicial determina l'abast del treball de neteja i permet identificar possibles gaps d'informació.
Comença creant una llista exhaustiva de tots els exchanges on has operat durant l'any fiscal, incloent-hi plataformes que hagis deixat d'utilitzar però on hagis realitzat operacions en el període a declarar. Per a cada exchange, identifica quins tipus d'exportació has realitzat seguint les guies específiques de cada plataforma. Si no has completat l'exportació d'algun exchange, et recomanem consultar la nostra guia per exportar l'historial de Binance correctament com a referència metodològica.
Checklist d'inventari de fonts
Exchanges centralitzats:
- Identificar totes les plataformes utilitzades (actives i inactives)
- Verificar que s'han exportat tots els tipus d'historial (trades, staking, earn, conversions)
- Documentar el rang de dates de cada exportació
- Anotar el format de cada arxiu (CSV, XLSX, JSON)
Wallets no custodials:
- Llistar totes les adreces de wallet utilitzades
- Identificar les xarxes blockchain on cada wallet té activitat
- Verificar exportacions d'Etherscan, Polygonscan, etc.
- Incloure tant transaccions com transferències de tokens
Estructura de carpetes recomanada:
📁 Dades_Fiscals_2024/
├── 📁 01_Originals_Intactes/
│ ├── 📁 Binance/
│ ├── 📁 Coinbase/
│ ├── 📁 Metamask_ETH/
│ └── 📁 Metamask_Polygon/
├── 📁 02_En_Procés/
└── 📁 03_Consolidat_Final/
Mantenir sempre una còpia intacta dels arxius exportats abans de realitzar qualsevol modificació és fonamental tant per a auditories internes com per a possibles requeriments de l'AEAT on hagis de demostrar la traçabilitat dels teus càlculs.
Fase 2: Normalització de formats de data i hora
Els formats de data representen un dels problemes més freqüents i potencialment greus en datasets de criptomonedes. Cada exchange utilitza el seu propi format, i les diferències poden semblar subtils però tenen conseqüències significatives per al càlcul fiscal.
Formats de data per plataforma
| Plataforma | Format original | Exemple | Zona horària |
|---|---|---|---|
| Binance | YYYY-MM-DD HH:MM:SS | 2024-06-15 14:32:18 | UTC |
| Coinbase | ISO 8601 | 2024-06-15T14:32:18Z | UTC |
| Kraken | Unix timestamp | 1718458338 | UTC |
| Etherscan | Unix timestamp | 1718458338 | UTC |
| Bitstamp | DD/MM/YYYY HH:MM | 15/06/2024 14:32 | CET |
Quan aquests arxius es combinen sense normalització, una ordenació cronològica pot produir resultats completament incorrectes perquè el programari interpreta els camps de manera diferent.
Protocol de normalització de dates
El procés ha de seguir aquests passos en ordre estricte:
- Identificar el format de cada arxiu font i documentar-lo explícitament
- Convertir tots els formats a ISO 8601 (YYYY-MM-DDTHH:MM:SS) per la seva ordenabilitat natural
- Ajustar la zona horària a Espanya (CET/CEST segons la data)
- Verificar la conversió comparant dates conegudes amb el registre original
Exemple crític de zona horària:
Una transacció a Etherscan:
2024-12-31 23:30:00 UTCConvertida a Espanya (horari d'hivern):
2025-01-01 00:30:00 CETAny fiscal: 2025, no 2024
Aquesta diferència determina en quin exercici fiscal s'ha de declarar l'operació, cosa que pot tenir implicacions significatives si es tracta d'una guanyança o pèrdua patrimonial rellevant.
Fase 3: Detecció i eliminació de duplicats
La duplicació de transaccions és l'error més comú i un dels més perjudicials en datasets de criptomonedes. Es produeix principalment per exportacions amb rangs de dates solapats i operacions que apareixen registrades de múltiples formes en diferents tipus d'exportació del mateix exchange.
Per detectar duplicats correctament, no n'hi ha prou amb comparar files idèntiques. Has d'implementar una lògica d'identificació basada en camps clau que defineixin la unicitat de cada transacció.
Camps clau per identificar duplicats
En exchanges centralitzats:
- Data i hora exacta (fins a segons)
- Parell de trading (BTC/EUR, ETH/USDT...)
- Tipus d'operació (buy, sell, trade)
- Quantitat executada
- Preu d'execució
En transaccions blockchain:
- Hash de transacció (txHash) → identificador únic definitiu
- Si no hi ha hash: combinació de bloc + from + to + value
Procés de deduplicació en tres passades
| Passada | Criteri | Acció |
|---|---|---|
| Primera | Files 100% idèntiques | Eliminar automàticament |
| Segona | Camps clau coincideixen, columnes secundàries difereixen | Eliminar conservant la informació més completa |
| Tercera | Transaccions similars no idèntiques | Revisió manual cas per cas |
Exemple de duplicat subtil:
Fila 1: 2024-06-15 14:32:18 | BTC/EUR | BUY | 0.05 | 62450.00 | fee: 0.0001
Fila 2: 2024-06-15 14:32:18 | BTC/EUR | BUY | 0.05 | 62450.00 | fee: (buit)
Ambdues representen la mateixa operació, però una té la comissió i l'altra no. La passada 2 ha de conservar la fila 1.
Mantén un registre de tots els duplicats eliminats. Aquest registre serveix com a documentació del procés de neteja i permet verificar que no s'han eliminat operacions legítimes per error. Si treballes amb eines d'anàlisi com les que descrivim a la nostra guia d'eines per rastrejar criptomonedes, moltes inclouen funcions de detecció de duplicats que pots utilitzar com a verificació creuada.
Fase 4: Classificació i estandardització de tipus d'operació
Cada exchange utilitza la seva pròpia terminologia per descriure els tipus d'operació. El que Binance anomena "SPOT Trade" pot aparèixer com a "Trade" a Coinbase, "Exchange" a Kraken o simplement "Buy" en altres plataformes. Per aplicar correctament el tractament fiscal a cada operació, necessites un sistema de classificació estandarditzat.
Taula de mapping: denominacions originals → categoria fiscal
| Denominació original | Exchange | Categoria fiscal estandarditzada |
|---|---|---|
| SPOT Trade, Trade, Exchange | Diversos | Permuta / Guany patrimonial |
| Buy, Purchase, Compra | Diversos | Adquisició |
| Sell, Venta | Diversos | Enajenació / Guany patrimonial |
| Convert, Conversion, Swap | Diversos | Permuta / Guany patrimonial |
| Deposit, Ingreso | Diversos | Moviment intern (verificar origen) |
| Withdrawal, Retiro | Diversos | Moviment intern (verificar destinació) |
| Staking Reward, Interest | Diversos | Rendiment del capital mobiliari |
| Airdrop, Distribution | Diversos | Rendiment del capital (valorar a mercat) |
| Fee, Commission, Gas | Diversos | Despesa deduïble |
Categories fiscals principals
La correcta classificació de cada operació en determina el tractament fiscal:
- Guanys/pèrdues patrimonials: Vendes, permutes entre criptos, pagaments amb cripto
- Rendiments del capital mobiliari: Staking, lending, farming, airdrops
- Moviments interns: Transferències entre wallets pròpies (no tributen)
- Despeses deduïbles: Comissions, gas fees, trading fees
Un error freqüent és classificar transferències entre wallets pròpies com a vendes, cosa que genera guanys patrimonials ficticis. Per aprofundir en els criteris de classificació segons l'AEAT, et recomanem consultar el nostre article sobre com classificar operacions de criptomonedes.
Fase 5: Conversió de valors a euros
L'AEAT requereix que totes les operacions es declarin en euros, valorades al tipus de canvi del moment exacte de cada transacció. Aquest requisit implica un procés de conversió que s'ha de realitzar amb precisió i amb fonts de cotització documentades.
Fonts de cotització recomanades
| Tipus d'actiu | Font primària | Font alternativa | Granularitat |
|---|---|---|---|
| BTC, ETH, top 20 | CoinGecko API | CoinMarketCap | Minuts |
| Altcoins líquides | CoinGecko API | Exchange on s'ha operat | Hores |
| Tokens il·líquids | Preu a l'exchange | DEX (Uniswap, etc.) | Transacció |
| Stablecoins USD | Tipus de canvi EUR/USD | BCE o OANDA | Diari |
Procés de conversió per a operacions cripto-cripto
Per a operacions realitzades en parells cripto-cripto, necessites una conversió en dues passes:
Exemple: Swap ETH → LINK a Uniswap
1. Operació original:
- Enviat: 2 ETH
- Rebut: 150 LINK
- Data: 2024-07-20 15:45:00 UTC
2. Pas 1 - Valorar ETH en EUR:
- Preu ETH el 20/07/2024 15:45: 3.200 €
- Valor enviat: 2 × 3.200 = 6.400 €
3. Pas 2 - Valorar LINK en EUR:
- Preu LINK el 20/07/2024 15:45: 42,50 €
- Valor rebut: 150 × 42,50 = 6.375 €
4. Resultat fiscal:
- Valor de transmissió: 6.375 € (el que reps)
- Si el cost d'adquisició dels ETH era 5.000 €:
- Guany patrimonial: 6.375 - 5.000 = 1.375 €
El procés ha de documentar la font de cada cotització utilitzada. Això és especialment important per a operacions d'alt valor on una diferència de cotització pot suposar milers d'euros de diferència en la guanyança patrimonial calculada.
A Cleriontax utilitzem bases de dades pròpies de cotitzacions històriques validades que ens permeten aplicar conversions precises fins i tot per a tokens poc líquids.
Fase 6: Tractament de camps buits i valors anòmals
Els camps buits i els valors anòmals en datasets de criptomonedes poden tenir múltiples causes legítimes, però també poden indicar problemes d'exportació que requereixen correcció. El tractament d'aquests casos ha de ser acurat per no eliminar informació vàlida ni propagar errors.
Interpretació de camps buits
| Camp buit | Interpretació probable | Acció |
|---|---|---|
| Fee / Comissió | Promoció sense fee o fee en un altre token | Verificar, si és correcte → 0 |
| Preu | Error greu d'exportació | Consultar l'historial original |
| Quantitat | Error greu d'exportació | Consultar l'historial original |
| Hash de transacció | Normal en exchanges centralitzats | Acceptable |
| Notes / Memo | Camp opcional no utilitzat | Ignorar |
Detecció de valors anòmals
Implementa validacions automàtiques que marquin valors sospitosos:
- Preu implícit ±20% vs mercat: Flag per a revisió manual
- Quantitats negatives: Error de signe, corregir
- Dates fora de rang: Exportació corrupta, tornar a exportar
- Fees superiors al 10% del valor: Verificar (pot ser legítim en xarxes congestionades)
Exemple d'anomalia legítima:
Operació: Swap 0.01 ETH → 50 USDC
Data: 2024-05-15 (congestió de xarxa per memecoin)
Gas fee: 0.008 ETH (80% del valor operat)
→ Sembla anòmal però és correcte. Documentar i conservar.
Cada anomalia s'ha d'investigar individualment per determinar si representa un error que cal corregir o una operació atípica però legítima.
Fase 7: Consolidació de múltiples fonts
Un cop cada arxiu font s'ha normalitzat individualment, el pas següent és consolidar totes les dades en un dataset únic que representi la totalitat de la teva activitat en criptomonedes durant el període fiscal.
Esquema de columnes unificat
| Columna | Tipus | Obligatòria | Descripció |
|---|---|---|---|
| fecha_hora | datetime | Sí | ISO 8601, zona horària Espanya |
| tipo_operacion | string | Sí | Categoria fiscal estandarditzada |
| cripto_enviada | string | Segons tipus | Símbol de l'actiu venut/enviat |
| cantidad_enviada | decimal | Segons tipus | Quantitat de l'actiu enviat |
| cripto_recibida | string | Segons tipus | Símbol de l'actiu comprat/rebut |
| cantidad_recibida | decimal | Segons tipus | Quantitat de l'actiu rebut |
| valor_eur | decimal | Sí | Valor de l'operació en EUR |
| fee_eur | decimal | Sí | Comissió total en EUR |
| fuente | string | Sí | Exchange/wallet d'origen |
| hash_tx | string | No | Hash de blockchain si aplica |
| notas | string | No | Observacions del procés |
Procés de consolidació
- Afegir una columna d'origen a cada registre abans de combinar
- Unificar noms de columnes segons l'esquema estàndard
- Combinar tots els arxius en un únic dataset
- Ordenar cronològicament per fecha_hora
- Executar una deduplicació final per si hi ha operacions creuades
Si la consolidació i el càlcul FIFO et resulten complexos, el nostre servei d'anàlisi de carteres inclou tot el procés de neteja, normalització i càlcul amb verificació professional de cada pas.
Fase 8: Validació creuada i verificació d'integritat
Abans d'utilitzar el dataset net per calcular la teva declaració fiscal, és imprescindible realitzar una validació creuada que verifiqui la integritat de les dades processades.
Tres verificacions obligatòries
1. Balanç de control
Calcula el saldo final de cada criptomoneda segons el teu dataset i compara'l amb el saldo real:
Saldo segons dataset BTC: 0.5423 BTC
Saldo real en exchanges + wallets: 0.5420 BTC
Diferència: 0.0003 BTC (0.05%)
→ Diferència acceptable per arrodoniments
Diferències superiors a l'1% requereixen investigació.
2. Recompte d'operacions
Registres originals totals: 2.847
Duplicats eliminats (documentats): 156
Registres en el dataset final: 2.691
2.847 - 156 = 2.691 ✓ Quadra
3. Coherència temporal
Revisa que no existeixin gaps temporals inexplicats. Si has operat activament tot l'any però el teu dataset mostra mesos sense activitat, pot indicar exportacions incompletes.
Aquesta fase de validació és on un servei professional de liquidacions fiscals aporta més valor, ja que l'experiència permet identificar patrons d'error que un usuari ocasional podria passar per alt.
Eines per automatitzar la neteja
Per a usuaris amb volums elevats de transaccions, el processament manual pot resultar impracticable. Aquestes eines ajuden a automatitzar part del procés:
Comparativa d'eines
| Eina | Volum recomanat | Nivell tècnic | Cost |
|---|---|---|---|
| Excel / Google Sheets | < 2.000 tx | Bàsic | Gratuït |
| Google Sheets + QUERY | < 5.000 tx | Intermedi | Gratuït |
| Python + pandas | Il·limitat | Avançat | Gratuït |
| Koinly / CoinTracking | < 10.000 tx | Bàsic | De pagament |
Per a Excel/Sheets:
- Funció ELIMINAR.DUPLICADOS per a la passada 1
- Taules dinàmiques per a la verificació de totals
- BUSCARV / VLOOKUP per afegir cotitzacions
- Format condicional per detectar anomalies
Per a usuaris tècnics (Python):
import pandas as pd
# Carregar i combinar fonts
df = pd.concat([binance_df, coinbase_df, etherscan_df])
# Normalitzar dates
df['fecha'] = pd.to_datetime(df['fecha'], utc=True)
df['fecha'] = df['fecha'].dt.tz_convert('Europe/Madrid')
# Eliminar duplicats per camps clau
df = df.drop_duplicates(subset=['fecha', 'par', 'tipo', 'cantidad'])
# Ordenar cronològicament
df = df.sort_values('fecha')
Les eines de fiscalitat cripto com Koinly inclouen funcions de neteja integrades, però apliquen els seus propis criteris que poden no coincidir exactament amb els requisits de l'AEAT. Recomanem utilitzar-les com a complement per a la verificació creuada.
Documentació del procés de neteja
Cada decisió presa durant el procés de neteja ha de quedar documentada. Aquesta documentació serveix per reproduir el procés si necessites recalcular, proporciona evidència davant possibles requeriments de l'AEAT i facilita la revisió per tercers.
Contingut del document de metodologia
- Inventari complet de fonts amb dates d'exportació
- Criteris de normalització aplicats a cada tipus de camp
- Taula de mapping de tipus d'operació
- Fonts de cotització utilitzades per a la conversió a EUR
- Registre de duplicats eliminats amb justificació
- Anomalies detectades i el seu tractament
- Resultats de les verificacions d'integritat
Conserva també tots els arxius intermedis del procés, no només els originals i el resultat final. Si posteriorment detectes un error, els arxius intermedis permeten identificar en quina fase es va introduir.
En els nostres serveis de seguiment de cartera, incloem documentació completa del procés d'anàlisi que lliurem juntament amb l'informe fiscal, garantint una traçabilitat total.
Errors crítics que has d'evitar
Hi ha errors en el procés de neteja amb conseqüències especialment greus:
1. Eliminar operacions legítimes com a "duplicats"
En trading actiu és freqüent executar múltiples operacions del mateix parell en intervals curts. Verifica que les transaccions siguin veritablement idèntiques abans d'eliminar-les.
2. Conversió de moneda incorrecta
Dividir quan havies de multiplicar, o utilitzar el tipus de canvi invers, genera valors absurds que poden passar desapercebuts sense verificacions de balanç.
3. Ignorar les comissions
Les fees són despeses deduïbles que redueixen la teva guanyança patrimonial. Un dataset on les comissions s'han perdut produeix una declaració que paga més impostos dels deguts.
4. Classificar moviments interns com a vendes
Els moviments entre els teus propis exchanges i wallets no generen tributació. Si es classifiquen com a vendes, produeixen guanys patrimonials ficticis que no hauries de pagar.
Si no tens seguretat en algun aspecte del procés, el nostre equip d'assessoria fiscal especialitzada en criptomonedes pot revisar la teva feina i detectar problemes abans que afectin la teva declaració.
Conclusió: dades netes, declaració correcta
La neteja de datasets de criptomonedes no és un pas opcional ni una millora cosmètica. És un requisit fonamental per obtenir una declaració fiscal precisa que compleixi amb els requisits de l'AEAT i que puguis defensar davant un possible requeriment. Un dataset brut produirà resultats incorrectes independentment de la qualitat del programari o la metodologia de càlcul que utilitzis posteriorment.
El procés complet requereix temps, atenció al detall i coneixement tant de l'operativa de criptomonedes com dels requisits fiscals espanyols. Per a usuaris amb operativa simple i poques transaccions, seguir aquesta guia hauria de ser suficient. Per a operatives complexes amb múltiples exchanges, activitat DeFi significativa o milers de transaccions, l'assistència professional pot estalviar temps i evitar errors costosos.
A Cleriontax combinem experiència en fiscalitat de criptomonedes amb metodologies rigoroses d'enginyeria de dades per garantir que cada informe que preparem es basa en dades verificades i traçables. Si prefereixes delegar aquest procés tècnic, els nostres serveis especialitzats estan dissenyats exactament per a això.
El teu pròxim pas: Si ja has exportat les teves dades i necessites ajuda amb la neteja, la consolidació o el càlcul fiscal, contacta amb el nostre equip per a una avaluació inicial sense compromís. Si encara estàs en fase d'exportació, visita el nostre blog on trobaràs guies específiques per a cada exchange i wallet.
Avís legal: Aquest article té finalitat informativa i educativa. No constitueix assessorament fiscal personalitzat. La normativa fiscal està subjecta a canvis i cada situació personal és única. Consulta sempre amb un assessor fiscal professional abans de prendre decisions fiscals.
Última actualització: Desembre 2025
Publicat per: Equip Cleriontax - Experts en Fiscalitat Cripto i Anàlisi de Dades
T'ha estat útil aquest article?
Comparteix-lo amb altres inversors que ho puguin necessitar


