Milliarder av datapunkter. Millioner av enheter. Tusenvis av nettsider.
Hvordan blir dette til noe meningsfullt?
Tre lag av datainnsamling
Companybook har en trelags tilnærming til data. Hvert lag bygger på det forrige og legger til mer dybde.
Lag 1: BRREG – Fundamentet
Alt starter med Brønnøysundregistrene. Dette er den autoritative kilden for:
- Organisasjonsnummer og selskapsnavn
- Adresse og kontaktinformasjon
- Organisasjonsform (AS, ENK, ANS, etc.)
- Styre og daglig leder
- Regnskapsdata for de som rapporterer
Vi synkroniserer mot BRREG flere ganger daglig. Nye selskaper dukker opp innen timer etter registrering.
Begrensningen: BRREG vet bare det selskapene er pålagt å rapportere. Den vet ingenting om hva selskapene faktisk gjør.
Lag 2: Website Crawling – Digital tilstedeværelse
Her begynner det å bli interessant. For hvert selskap med en nettside, henter vi:
- Teknologi-stack: Hvilke rammeverk, CMS, analyseverktøy bruker de?
- Sosiale profiler: LinkedIn, Instagram, TikTok, Facebook
- Metadata: Titler, beskrivelser, strukturerte data
- Kontaktinformasjon: E-post, telefon (fra nettsiden)
Dette gir oss et bilde av selskapets digitale modenhet. Et selskap med moderne tech stack, aktive sosiale profiler og oppdatert nettside opererer annerledes enn ett med en statisk HTML-side fra 2010.
Lag 3: Deep Enrichment – AI-basert analyse
Her bruker vi LLM-er (store språkmodeller) til å forstå hva selskapene gjør. Dette er det dyreste og mest tidkrevende laget, så vi bruker det selektivt.
For en restaurant kan dette bety:
- Hva slags mat serverer de?
- Har de naturvin? Michelin-stjerne?
- Hva er prisnivået?
- Når har de åpent?
For et SaaS-selskap:
- Hva er hovedproduktet?
- Hvem er målgruppen?
- Hva koster det?
- Hvilke integrasjoner tilbyr de?
Signal-typer
All denne informasjonen lagres som signals – strukturerte datapunkter med en type og verdi. Noen eksempler:
| Signal | Type | Eksempelverdi |
|---|---|---|
business_type | Bransje | "Restaurant", "Konsulent", "Nettbutikk" |
cuisine_type | Mat | "Italiensk", "Japansk", "Nordisk" |
tech_stack | Teknologi | ["Next.js", "Vercel", "Stripe"] |
social_presence | Sosiale medier | ["LinkedIn", "Instagram"] |
price_level | Prisnivå | "$$" |
Signaler er JSONB i databasen, noe som gir oss fleksibilitet til å lagre vilkårlige strukturerte data.
Hvorfor dette betyr noe
Tradisjonelle bedriftsoversikter stopper ved regnskapsdata. "Selskap X hadde 50 millioner i omsetning og 10% margin."
Det er nyttig, men det forteller deg ikke:
- Om de er relevante for deg
- Hva de faktisk selger
- Hvordan de opererer
- Om de er på vei opp eller ned
Med signaler kan vi bygge mye rikere søk og filtere. I stedet for å søke på "restaurant i Oslo", kan du søke på "italienske restauranter i Oslo med naturvin og prisnivå under 1000kr."
Hva er neste steg?
Vi jobber med å utvide signal-dekningen til flere bransjer. Retail, hotell, helsetjenester – alle har sine unike datapunkter vi kan fange opp.
Målet er at Companybook skal være den mest komplette kilden til innsikt om norske selskaper – ikke bare tall, men kontekst.
Har du ideer til signaler vi burde tracke? Si ifra.
