Pipeline ETL per a Fiscalitat Cripto: Automatitza la teva Declaració
Aprèn a dissenyar un pipeline ETL professional que transformi el caos de dades de múltiples exchanges i wallets en informació fiscal precisa i auditable. Arquitectura, eines i millors pràctiques per automatitzar la teva declaració de criptomonedes.
Equip Cleriontax
Experts en Fiscalitat Crypto i Anàlisi de Dades

Quan gestiones operacions en cinc exchanges diferents, tres wallets no custodials i participes en protocols DeFi, la preparació de la teva declaració fiscal es converteix en un exercici d'enginyeria de dades més que de comptabilitat tradicional. Cada font genera informació en formats diferents, amb nomenclatures pròpies i estructures incompatibles entre si. La solució professional a aquest problema és el que en el món de l'enginyeria de dades es coneix com un pipeline ETL: un sistema estructurat que extreu dades de múltiples fonts, les transforma a un format unificat i les carrega en una destinació on poden analitzar-se correctament.
Aquest article et guiarà a través del disseny i implementació d'un pipeline ETL adaptat específicament a les necessitats fiscals dels usuaris de criptomonedes a Espanya. No es tracta de teoria abstracta, sinó d'una metodologia pràctica que apliquem a Cleriontax per processar milers de transaccions i generar informes fiscals precisos per als nostres clients.
Què és un pipeline ETL i per què el necessites
ETL són les sigles d'Extract, Transform, Load (Extreure, Transformar, Carregar). És un patró d'arquitectura de dades que porta dècades utilitzant-se en el món empresarial per consolidar informació de múltiples sistemes dispars en una única font de veritat. En el context de la fiscalitat de criptomonedes, un pipeline ETL resol el problema fonamental de tenir dades fragmentades en dotzenes de fonts diferents que necessiten consolidar-se per calcular correctament el mètode FIFO obligatori a Espanya.
Sense un pipeline estructurat, el procés manual típic implica exportar CSVs de cada exchange, obrir-los un per un a Excel, intentar homogeneïtzar formats de data, convertir valors a euros amb cotitzacions buscades manualment, i finalment copiar i enganxar tot en un full mestre esperant no cometre errors. Aquest enfocament funciona per a carteres simples amb poques operacions, però escala terriblement malament. Cada exchange addicional multiplica el treball, i qualsevol error en el procés es propaga silenciosament fins al resultat final.
Un pipeline ETL ben dissenyat automatitza cada pas d'aquest procés, garanteix consistència en les transformacions, documenta cada operació realitzada i permet reprocessar les dades quan sigui necessari. És la diferència entre artesania manual i producció industrial: el resultat pot ser similar, però la fiabilitat, escalabilitat i traçabilitat no tenen comparació.
Els tres pilars de l'ETL fiscal
El pipeline per a fiscalitat cripto s'estructura en tres fases clarament diferenciades, cadascuna amb els seus propis desafiaments tècnics.
Extract (Extracció): Obtenir les dades brutes de cada font. Això inclou l'exportació manual de CSVs des d'interfícies d'usuari, l'ús d'APIs quan estan disponibles, i la consulta directa a exploradors de blockchain per a wallets no custodials. El desafiament principal és garantir que l'extracció sigui completa i que no quedin operacions sense capturar.
Transform (Transformació): Convertir les dades extretes al format unificat requerit per al càlcul fiscal. Aquí es normalitzen dates, s'estandarditzen tipus d'operació, es converteixen valors a euros i es classifiquen les transaccions segons el seu tractament fiscal. Aquesta fase és on es concentra la major complexitat tècnica i on els errors tenen conseqüències més greus.
Load (Càrrega): Emmagatzemar les dades transformades en la destinació final. Pot ser una base de dades, un full de càlcul estructurat o directament el format d'entrada d'una eina de càlcul FIFO. La càrrega ha de garantir integritat i permetre consultes eficients sobre les dades consolidades.
Arquitectura del pipeline fiscal
Abans d'escriure una sola línia de codi o configurar qualsevol eina, necessites dissenyar l'arquitectura del teu pipeline. Una arquitectura ben pensada facilita el manteniment, permet afegir noves fonts sense redissenyar tot el sistema i garanteix que les dades flueixin de manera predictible.
Diagrama de flux conceptual
L'estructura general del pipeline segueix un patró de convergència: múltiples fonts heterogènies es processen en paral·lel, cadascuna amb el seu propi connector d'extracció i les seves regles de transformació específiques, per finalment convergir en un model de dades unificat.
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ Binance │ │ Kraken │ │ Metamask │
│ (CSV) │ │ (CSV) │ │ (Etherscan) │
└──────┬──────┘ └──────┬──────┘ └──────┬──────┘
│ │ │
▼ ▼ ▼
┌──────────────────────────────────────────────────┐
│ CAPA D'EXTRACCIÓ │
│ Parsers específics per font │
└──────────────────────┬───────────────────────────┘
│
▼
┌──────────────────────────────────────────────────┐
│ CAPA DE TRANSFORMACIÓ │
│ - Normalització dates (UTC → CET) │
│ - Estandardització tipus operació │
│ - Conversió valors a EUR │
│ - Classificació fiscal │
│ - Detecció duplicats │
└──────────────────────┬───────────────────────────┘
│
▼
┌──────────────────────────────────────────────────┐
│ CAPA DE CÀRREGA │
│ Dataset consolidat format estàndard │
└──────────────────────┬───────────────────────────┘
│
▼
┌──────────────────────────────────────────────────┐
│ MOTOR FIFO + INFORMES │
│ Càlcul guanys patrimonials │
│ Generació informes AEAT │
└──────────────────────────────────────────────────┘
Model de dades canònic
El cor de qualsevol pipeline ETL exitós és el model de dades canònic: l'estructura estàndard a la qual es transformen totes les dades independentment del seu origen. Definir aquest model correctament des del principi evita redissenys costosos posteriors.
Per a fiscalitat de criptomonedes, el model canònic ha de capturar tota la informació necessària per al càlcul FIFO i la classificació fiscal. Després d'anys refinant la nostra metodologia, a Cleriontax utilitzem un model amb els següents camps essencials.
| Camp | Tipus | Descripció | Exemple |
|---|---|---|---|
| id_transaccio | string | Identificador únic | "BIN_2024_00001" |
| timestamp_utc | datetime | Moment exacte en UTC | 2024-06-15T14:32:18Z |
| timestamp_local | datetime | Convertit a hora Espanya | 2024-06-15T16:32:18 |
| font | string | Origen de la dada | "binance" |
| tipus_operacio | enum | Categoria estandarditzada | "permuta" |
| tipus_fiscal | enum | Classificació AEAT | "guany_patrimonial" |
| actiu_origen | string | Símbol enviat | "BTC" |
| quantitat_origen | decimal | Quantitat enviada | 0.05 |
| actiu_desti | string | Símbol rebut | "ETH" |
| quantitat_desti | decimal | Quantitat rebuda | 0.85 |
| valor_eur | decimal | Valor en euros | 3250.00 |
| fee_eur | decimal | Comissió en euros | 6.50 |
| cotitzacio_origen | decimal | Preu EUR de l'actiu origen | 65000.00 |
| cotitzacio_desti | decimal | Preu EUR de l'actiu destí | 3823.53 |
| hash_blockchain | string | Hash si aplica | "0x7f8..." |
| notes | string | Observacions | "" |
Aquest model és prou ric per capturar qualsevol tipus d'operació cripto i prou estructurat per permetre anàlisis automatitzades. La clau està en que cada registre segueix exactament la mateixa estructura, independentment de si prové de Binance, un DEX o una transacció manual.
Fase d'extracció: connectors per font
L'extracció és la fase més variable del pipeline perquè cada font té les seves pròpies peculiaritats. Construir connectors robustos que manegen les idiosincràsies de cada exchange és fonamental per a la fiabilitat del sistema.
Extracció d'exchanges centralitzats
Els exchanges centralitzats ofereixen generalment dos mètodes d'extracció: exportació manual de CSVs des de la interfície web i accés programàtic mitjançant APIs. Per a un pipeline de fiscalitat personal, l'exportació CSV sol ser suficient i més senzilla d'implementar. Les APIs són més útils quan necessites automatització contínua o processes múltiples clients.
El connector per a cada exchange ha de conèixer l'estructura específica de les seves exportacions. Binance, per exemple, genera CSVs amb columnes com "Date(UTC)", "Pair", "Side", "Price", "Executed", "Amount", "Fee". Kraken utilitza "time", "pair", "type", "ordertype", "price", "cost", "fee". Encara que conceptualment contenen la mateixa informació, la implementació del parser és completament diferent.
Extracció de wallets i blockchain
Les wallets no custodials com Metamask no emmagatzemen el teu historial de transaccions de forma centralitzada. Les dades viuen a la blockchain i s'han d'extreure consultant exploradors com Etherscan, Polygonscan o l'explorador corresponent a cada xarxa on tinguis activitat.
Aquests exploradors ofereixen exportació de transaccions, però la informació que proporcionen és més crua que la dels exchanges. No hi ha conceptes com "compra" o "venda", només transferències de tokens entre adreces. Interpretar què significa cada transacció requereix lògica addicional: una transferència a Uniswap seguida d'una recepció d'un altre token és un swap; una transferència a la teva pròpia adreça en una altra xarxa pot ser un bridge.
Fase de transformació: el nucli del pipeline
La transformació és on passa la màgia del pipeline i on es concentra la major part de la lògica de negoci. Cada transformació ha de ser determinista, reproduïble i documentada.
Normalització de timestamps
La primera transformació crítica és normalitzar totes les dates a un format i zona horària consistents. Els exchanges utilitzen diferents formats i la majoria reporta en UTC, però la legislació espanyola determina l'any fiscal segons l'hora local.
Estandardització de tipus d'operació
Cada exchange utilitza la seva pròpia taxonomia per descriure operacions. El pipeline ha de mapejar totes aquestes variants a un conjunt reduït de tipus estandarditzats que tenen significat fiscal definit.
La nostra taxonomia fiscal estàndard inclou els següents tipus. Les adquisicions són compres de crypto amb fiat, entrades de fons que estableixen cost d'adquisició. Les alienacions són vendes de crypto a fiat, generen guany o pèrdua patrimonial. Les permutes són intercanvis entre criptomonedes, també generen guany o pèrdua. Els rendiments inclouen staking, lending, airdrops, que tributen com a rendiment del capital. Els moviments interns són transferències entre wallets pròpies, no tributen però s'han de documentar. Les comissions són fees i gas, despeses deduïbles del valor de l'operació.
Conversió a euros
Totes les operacions s'han de valorar en euros per a la declaració fiscal espanyola. Això requereix obtenir cotitzacions històriques precises per a cada actiu en el moment exacte de cada transacció.
Fase de càrrega: destinació i format final
La càrrega és la fase més directa del pipeline, però requereix atenció a detalls com la integritat referencial, l'atomicitat de les operacions i la capacitat de recàrrega en cas d'errors.
Opcions d'emmagatzematge
Per a un pipeline personal, les opcions d'emmagatzematge van des de simples arxius CSV fins a bases de dades relacionals completes. L'elecció depèn del volum de dades i de com planegis consumir la informació posteriorment.
Un arxiu CSV estructurat és suficient per a la majoria d'usuaris individuals. És portable, pot obrir-se a Excel per a inspecció manual i és el format d'entrada de moltes eines de càlcul fiscal.
Orquestració i automatització
Un pipeline veritablement útil no és quelcom que executes manualment pas a pas. L'orquestració automatitza la seqüència d'operacions, gestiona errors i permet programar execucions periòdiques.
Gestió d'errors i reintents
Els errors són inevitables en qualsevol pipeline de dades. Una API de cotitzacions pot no respondre, un arxiu CSV pot estar corrupte, o una transformació pot trobar un valor inesperat.
El pipeline ha de distingir entre errors recuperables i fatals. Un timeout d'API és recuperable amb reintents i backoff exponencial. Un camp obligatori buit a les dades d'entrada és fatal i requereix correcció manual.
Conclusió: de dades caòtiques a declaració precisa
Un pipeline ETL per a fiscalitat cripto transforma el caos inherent a operar en múltiples plataformes en informació estructurada, verificable i llesta per calcular les teves obligacions fiscals. La inversió inicial en dissenyar i implementar aquest sistema s'amortitza ràpidament en temps estalviat, errors evitats i tranquil·litat en presentar la teva declaració.
Per a usuaris tècnics amb temps disponible, construir el teu propi pipeline és un projecte educatiu que et dóna control total sobre el procés. Per a la resta, té més sentit delegar en professionals que ja tenen els sistemes construïts, provats i optimitzats.
A Cleriontax portem anys refinant la nostra infraestructura de processament de dades fiscals. Si prefereixes enfocar-te en les teves inversions en lloc d'enginyeria de dades, el nostre servei d'anàlisi de carteres et proporciona resultats professionals sense necessitat d'entendre els detalls tècnics del pipeline que els genera.
El teu proper pas: Si tens coneixements tècnics i vols implementar el teu propi pipeline, comença pel model de dades canònic i construeix des d'allà. Si prefereixes una solució claus en mà, contacta amb el nostre equip i explica'ns la teva situació per recomanar-te la millor opció.
Descàrrec de responsabilitat: Aquest article té finalitat informativa i educativa. No constitueix assessorament fiscal ni tècnic personalitzat. La normativa fiscal està subjecta a canvis i cada situació personal és única. Consulta sempre amb professionals abans de prendre decisions fiscals.
Última actualització: Gener 2026
Publicat per: Equip Cleriontax - Experts en Fiscalitat Crypto i Enginyeria de Dades
T'ha estat útil aquest article?
Comparteix-lo amb altres inversors que ho puguin necessitar


