Wip 4 - Pushing Python

2026-01-02 01:49:21 +01:00 · 2026-01-02 01:49:21 +01:00 · 8096a979ea
commit 8096a979ea
parent f85fbde89d
24 changed files with 1074 additions and 0 deletions
--- a/apps/pyMetadata/config/init.py
+++ b/apps/pyMetadata/config/init.py
--- a/apps/pyMetadata/config/database_config.py
+++ b/apps/pyMetadata/config/database_config.py
@ -0,0 +1,29 @@
 import os
 from dataclasses import dataclass
@dataclass
 class DatabaseConfig:
    address: str
    port: int
    name: str
    username: str
    password: str
    @staticmethod
    def from_env() -> "DatabaseConfig":
        return DatabaseConfig(
            address=os.environ.get("DATABASE_ADDRESS") or "192.168.2.250",
            port=int(os.environ.get("DATABASE_PORT") or "3306"),
            name=os.environ.get("DATABASE_NAME_E") or "eventsV3",
            username=os.environ.get("DATABASE_USERNAME") or "root",
            password=os.environ.get("DATABASE_PASSWORD") or "def",
        )
    def validate(self) -> None:
        if not self.address:
            raise ValueError("Database address mangler")
        if not self.name:
            raise ValueError("Database name mangler")
        if not self.username:
            raise ValueError("Database username mangler")
        # du kan legge til flere regler her
--- a/apps/pyMetadata/db/init.py
+++ b/apps/pyMetadata/db/init.py
--- a/apps/pyMetadata/db/database.py
+++ b/apps/pyMetadata/db/database.py
@ -0,0 +1,53 @@
 from config.database_config import DatabaseConfig
 from utils.logger import logger
 import mysql.connector
 from mysql.connector import Error
 from utils.backoff import wait_with_backoff
 class Database:
    def __init__(self, config: DatabaseConfig):
        self.config = config
        self.conn = None
    def connect(self):
        """Koble til DB med backoff."""
        self.config.validate()
        while True:
            try:
                self.conn = mysql.connector.connect(
                    host=self.config.address,
                    user=self.config.username,
                    password=self.config.password,
                    database=self.config.name
                )
                if self.conn.is_connected(): 
                    logger.info("✅ Tilkoblet til databasen")
                    return
            except Error as e:
                logger.error(f"❌ DB-tilkobling feilet: {e}")
                for _ in wait_with_backoff():
                    try:
                        self.conn = mysql.connector.connect(
                            host=self.config.address,
                            user=self.config.username,
                            password=self.config.password,
                            database=self.config.name
                        )
                        if self.conn.is_connected():
                            logger.info("✅ Tilkoblet til databasen")
                            return
                    except Error:
                        continue
    def validate(self):
        """Sjekk at tilkoblingen er aktiv."""
        if not self.conn or not self.conn.is_connected():
            logger.warning("⚠️ Tilkobling mistet, prøver igjen...")
            self.connect()
    def query(self, sql: str, params=None):
        """Kjør en spørring med validering."""
        self.validate()
        cursor = self.conn.cursor(dictionary=True)
        cursor.execute(sql, params or ())
        return cursor.fetchall()
--- a/apps/pyMetadata/db/repository.py
+++ b/apps/pyMetadata/db/repository.py
@ -0,0 +1,108 @@
 from datetime import datetime
 import json
 from typing import Optional
 from db.database import Database
 from models.enums import TaskStatus
 from models.event import MetadataSearchResultEvent
 from models.task import Task, MetadataSearchTask, MetadataSearchData
 from utils.logger import logger
 def fetch_next_task(db: Database) -> Optional[Task]:
    db.validate()
    cursor = db.conn.cursor(dictionary=True)
    cursor.execute(
        "SELECT * FROM TASKS WHERE STATUS='Pending' AND CLAIMED=0 AND CONSUMED=0 "
        "ORDER BY PERSISTED_AT ASC LIMIT 1"
    )
    row = cursor.fetchone()
    if not row:
        return None
    try:
        if row["TASK"] == "MetadataSearchTask":
            # hele JSON ligger i DATA
            return MetadataSearchTask.model_validate_json(row["DATA"])
        else:
            return Task.model_validate_json(row["DATA"])
    except Exception as e:
        logger.error(f"❌ Feil ved deserialisering av task {row.get('TASK_ID')}: {e}")
        mark_failed(db, row["TASK_ID"])
        return None
 def mark_failed(db: Database, task_id: str) -> None:
    cursor = db.conn.cursor()
    cursor.execute(
        "UPDATE TASKS SET STATUS='Failed' WHERE TASK_ID=%s",
        (task_id,)
    )
    db.conn.commit()
 def claim_task(db: Database, task_id: str, worker_id: str) -> bool:
    """
    Marker en task som claimed av en gitt worker.
    Returnerer True hvis claim lykkes, False hvis task allerede er claimed.
    """
    db.validate()
    try:
        cursor = db.conn.cursor()
        # Oppdater bare hvis task ikke allerede er claimed
        cursor.execute(
            """
            UPDATE TASKS
            SET CLAIMED=1, CLAIMED_BY=%s, LAST_CHECK_IN=%s
            WHERE TASK_ID=%s AND CLAIMED=0 AND CONSUMED=0
            """,
            (worker_id, datetime.now(), task_id)
        )
        db.conn.commit()
        return cursor.rowcount > 0
    except Exception as e:
        db.conn.rollback()
        raise RuntimeError(f"Claim feilet: {e}")
 def persist_event_and_mark_consumed(db: Database, event: MetadataSearchResultEvent, task_id: str) -> None:
    """
    Persisterer et event og markerer tilhørende task som consumed i én transaksjon.
    Ruller tilbake hvis noe feiler.
    """
    db.validate()
    try:
        cursor = db.conn.cursor()
        # 1. Insert event
        as_data = event.model_dump_json()  # Pydantic v2
        event_name = event.__class__.__name__
        cursor.execute(
            """
            INSERT INTO EVENTS (REFERENCE_ID, EVENT_ID, EVENT, DATA, PERSISTED_AT)
            VALUES (%s, %s, %s, %s, %s)
            """,
            (
                str(event.referenceId),
                str(event.eventId),
                event_name,
                as_data,
                datetime.now().isoformat()
            )
        )
        # 2. Update task status
        cursor.execute(
            "UPDATE TASKS SET STATUS=%s, CONSUMED=1 WHERE TASK_ID=%s",
            (TaskStatus.COMPLETED.value, task_id)
        )
        # 3. Commit begge operasjoner
        db.conn.commit()
    except Exception as e:
        # Rull tilbake hvis noe feiler
        db.conn.rollback()
        raise RuntimeError(f"Transaksjon feilet: {e}")
--- a/apps/pyMetadata/models/init.py
+++ b/apps/pyMetadata/models/init.py
--- a/apps/pyMetadata/models/enums.py
+++ b/apps/pyMetadata/models/enums.py
@ -0,0 +1,11 @@
 from enum import Enum
 class TaskStatus(Enum):
    PENDING = "Pending"
    IN_PROGRESS = "InProgress"
    COMPLETED = "Completed"
    FAILED = "Failed"
 class MediaType(Enum):
    MOVIE = "Movie"
    SERIE = "Serie"
--- a/apps/pyMetadata/models/event.py
+++ b/apps/pyMetadata/models/event.py
@ -0,0 +1,48 @@
 # models/event.py
 from pydantic import BaseModel
 from datetime import datetime
 from typing import List, Set
 from uuid import UUID
 from models.enums import MediaType, TaskStatus
 class EventMetadata(BaseModel):
    created: datetime
    derivedFromId: Set[UUID]   # nøyaktig feltnavn
 class Summary(BaseModel):
    language: str
    description: str
 class MetadataResult(BaseModel):
    source: str
    title: str
    alternateTitles: List[str]
    cover: str | None
    bannerImage: str | None    # behold camelCase
    type: MediaType
    summary: List[Summary]
    genres: List[str]
 class SearchResult(BaseModel):
    simpleScore: int
    prefixScore: int
    advancedScore: int
    sourceWeight: float
    metadata: MetadataResult
 class MetadataSearchResultEvent(BaseModel):
    # Påkrevde felter
    referenceId: UUID
    eventId: UUID
    metadata: EventMetadata
    # Custom felter
    results: List[SearchResult]
    recommended: SearchResult|None
    status: TaskStatus
--- a/apps/pyMetadata/models/metadata.py
+++ b/apps/pyMetadata/models/metadata.py
@ -0,0 +1,39 @@
 from dataclasses import dataclass, asdict
 from typing import List, Optional
 from enum import Enum
 from models.enums import MediaType
@dataclass
 class Summary:
    summary: str
    language: str
    def to_dict(self):
        return {k: v.strip() if isinstance(v, str) else v for k, v in asdict(self).items()}
@dataclass
 class Metadata:
    title: str
    altTitle: List[str]
    cover: str
    banner: Optional[str]
    type: MediaType
    summary: List[Summary]
    genres: List[str]
    source: str
    def to_dict(self):
        def trim(item):
            if isinstance(item, str):
                return item.strip()
            elif isinstance(item, list):
                return [trim(sub_item) for sub_item in item]
            elif isinstance(item, Enum):
                return item.value
            elif hasattr(item, "to_dict"):
                return item.to_dict()
            return item
        return {key: trim(value) for key, value in asdict(self).items()}
--- a/apps/pyMetadata/models/task.py
+++ b/apps/pyMetadata/models/task.py
@ -0,0 +1,28 @@
 # models/task.py
 from pydantic import BaseModel
 from uuid import UUID
 from datetime import datetime
 from typing import List, Optional
 from models.enums import TaskStatus
 class MetadataSearchData(BaseModel):
    searchTitles: List[str]
    collection: str
 class Task(BaseModel):
    referenceId: UUID
    taskId: UUID
    task: str
    status: TaskStatus
    data: dict   # generisk payload hvis du ikke vet typen
    claimed: bool
    claimedBy: Optional[str]
    consumed: bool
    lastCheckIn: Optional[datetime]
    persistedAt: datetime
 class MetadataSearchTask(Task):
    data: MetadataSearchData
--- a/apps/pyMetadata/requirments-test.txt
+++ b/apps/pyMetadata/requirments-test.txt
@ -0,0 +1,2 @@
 pytest==9.0.2
 pytest-asyncio==1.3.0
--- a/apps/pyMetadata/sources/factory.py
+++ b/apps/pyMetadata/sources/factory.py
@ -0,0 +1,15 @@
 from typing import List
 from .mal import Mal
 from .anii import Anii
 from .imdb import Imdb
 from .source import SourceBase
 def get_all_sources(titles: List[str]) -> List[SourceBase]:
    """
    Returnerer alle aktive kilder som implementerer SourceBase.
    """
    return [
        Mal(titles),
        Anii(titles),
        Imdb(titles),
    ]
--- a/apps/pyMetadata/tests/test_poller.py
+++ b/apps/pyMetadata/tests/test_poller.py
@ -0,0 +1,138 @@
 from typing import Set
 import pytest
 from models.event import MetadataSearchResultEvent, EventMetadata
 from worker.poller import run_worker, run_iteration
 from models.task import MetadataSearchTask, MetadataSearchData
 from models.enums import TaskStatus
 import uuid
 from datetime import datetime
 import time
 def make_dummy_event():
    return MetadataSearchResultEvent(
        referenceId=uuid.uuid4(),
        eventId=uuid.uuid4(),
        metadata=EventMetadata(
            created=datetime.now(),
            derivedFromId={uuid.uuid4()}
        ),
        results=[],
        persistedAt=datetime.now(),
        recommended=None,              # fyll inn med en gyldig bool
        status="Completed"                # eller enum hvis modellen krever det
    )
 def make_task():
    return MetadataSearchTask(
        referenceId=uuid.uuid4(),
        taskId=uuid.uuid4(),
        task="MetadataSearchTask",
        status=TaskStatus.PENDING,
        data=MetadataSearchData(searchTitles=["foo"], collection="bar"),
        claimed=False,
        claimedBy=None,
        consumed=False,
        lastCheckIn=None,
        persistedAt=datetime.now()
    )
 def test_run_worker_processes_one(monkeypatch):
    events = []
    task = make_task()
    class FakeDB:
        def connect(self): pass
        def close(self): pass
    calls = {"n": 0}
    def fetch_once(db):
        if calls["n"] == 0:
            calls["n"] += 1
            return task
        calls["n"] += 1
        return None
    monkeypatch.setattr("worker.poller.fetch_next_task", fetch_once)
    monkeypatch.setattr("worker.poller.claim_task", lambda *a, **k: True)
    # Viktig: async stub
    async def fake_process_task(task):
        return make_dummy_event()
    monkeypatch.setattr("worker.poller.process_task", fake_process_task)
    def persist_stub(db, event, task_id):
        events.append("dummy_event")
    monkeypatch.setattr("worker.poller.persist_event_and_mark_consumed", persist_stub)
    monkeypatch.setattr("worker.poller.mark_failed", lambda *a, **k: events.append("failed"))
    monkeypatch.setattr("worker.poller.time.sleep", lambda s: None)
    run_worker(db=FakeDB(), shutdown_flag_ref=lambda: calls["n"] >= 2)
    assert "dummy_event" in events
 def test_backoff(monkeypatch):
    intervals = []
    class FakeDB:
        def connect(self): pass
        def close(self): pass
    # monkeypatch fetch_next_task til å returnere None flere ganger
    monkeypatch.setattr("worker.poller.fetch_next_task", lambda db: None)
    # monkeypatch time.sleep til å fange poll_interval
    def fake_sleep(seconds):
        intervals.append(seconds)
    monkeypatch.setattr(time, "sleep", fake_sleep)
    # monkeypatch claim_task, process_task osv. til dummy
    monkeypatch.setattr("worker.poller.claim_task", lambda db, tid, wid: True)
    monkeypatch.setattr("worker.poller.process_task", lambda t: "dummy_event")
    monkeypatch.setattr("worker.poller.persist_event_and_mark_consumed", lambda db, e, tid: None)
    monkeypatch.setattr("worker.poller.mark_failed", lambda db, tid: None)
    # kjør bare noen få iterasjoner ved å stoppe med shutdown_flag_ref
    run_worker(db=FakeDB(), shutdown_flag_ref=lambda: len(intervals) >= 4)
    # verifiser at intervallet øker (5 → 10 → 20 → 40)
    assert intervals == [5, 10, 20, 40]
 def test_backoff_on_connection_error(monkeypatch):
    intervals = []
    reconnects = []
    class FakeDB:
        def connect(self):
            reconnects.append("reconnect")
        def close(self): pass
    # Først: fetch_next_task kaster exception
    def failing_fetch(db):
        raise RuntimeError("DB connection lost")
    monkeypatch.setattr("worker.poller.fetch_next_task", failing_fetch)
    # monkeypatch time.sleep til å fange poll_interval
    def fake_sleep(seconds):
        intervals.append(seconds)
    monkeypatch.setattr(time, "sleep", fake_sleep)
    # dummy funksjoner
    monkeypatch.setattr("worker.poller.claim_task", lambda db, tid, wid: True)
    monkeypatch.setattr("worker.poller.process_task", lambda t: "dummy_event")
    monkeypatch.setattr("worker.poller.persist_event_and_mark_consumed", lambda db, e, tid: None)
    monkeypatch.setattr("worker.poller.mark_failed", lambda db, tid: None)
    # kjør bare noen få iterasjoner
    run_worker(db=FakeDB(), shutdown_flag_ref=lambda: len(reconnects) >= 2)
    # verifiser at reconnect ble kalt
    assert reconnects == ["reconnect", "reconnect"]
    # verifiser at poll_interval ble reset til 5 etter feil
    assert all(interval == 5 for interval in intervals)
--- a/apps/pyMetadata/tests/test_processor.py
+++ b/apps/pyMetadata/tests/test_processor.py
@ -0,0 +1,113 @@
 import asyncio
 import uuid
 from datetime import datetime
 import pytest
 import worker.processor as processor
 from models.task import MetadataSearchTask, MetadataSearchData, TaskStatus
 from models.metadata import Metadata, Summary, MediaType
 # --- Helpers ---
 def make_dummy_metadata(source="mal", title="Foo"):
    return Metadata(
        title=title,
        altTitle=[],
        cover="cover.jpg",
        banner=None,
        type=MediaType.MOVIE,
        summary=[Summary(summary="A fake summary", language="en")],
        genres=["Drama"],
        source=source,
    )
 def make_dummy_task():
    return MetadataSearchTask(
        referenceId=uuid.uuid4(),
        taskId=uuid.uuid4(),
        task="MetadataSearchTask",
        status=TaskStatus.PENDING,
        data=MetadataSearchData(searchTitles=["Foo"], collection="bar"),
        claimed=False,
        claimedBy=None,
        consumed=False,
        lastCheckIn=None,
        persistedAt=datetime.now()
    )
 # --- Tests ---
@pytest.mark.asyncio
 async def test_process_task_success(monkeypatch):
    # Async stub for run_search
    async def good_search(titles):
        return [make_dummy_metadata("mal"), make_dummy_metadata("imdb")]
    monkeypatch.setattr(processor, "run_search", good_search)
    # Matchers return fixed scores
    class DummyMatcher:
        def __init__(self, title, m): pass
        def getScore(self): return 50
    monkeypatch.setattr(processor, "SimpleMatcher", DummyMatcher)
    monkeypatch.setattr(processor, "PrefixMatcher", DummyMatcher)
    monkeypatch.setattr(processor, "AdvancedMatcher", DummyMatcher)
    # Fake DB and mark_failed
    class FakeDB: pass
    called = {}
    monkeypatch.setattr(processor, "mark_failed", lambda db, tid: called.setdefault("failed", True))
    task = make_dummy_task()
    event = await processor.process_task(FakeDB(), task)
    assert isinstance(event, processor.MetadataSearchResultEvent)
    assert event.status == TaskStatus.COMPLETED
    assert event.recommended is not None
    assert "failed" not in called
@pytest.mark.asyncio
 async def test_process_task_no_results(monkeypatch):
    async def empty_search(titles):
        return []
    monkeypatch.setattr(processor, "run_search", empty_search)
    class FakeDB: pass
    called = {}
    monkeypatch.setattr(processor, "mark_failed", lambda db, tid: called.setdefault("failed", True))
    task = make_dummy_task()
    event = await processor.process_task(FakeDB(), task)
    assert event is None
    assert "failed" in called
@pytest.mark.asyncio
 async def test_process_task_exception(monkeypatch):
    async def bad_search(titles):
        raise RuntimeError("boom")
    monkeypatch.setattr(processor, "run_search", bad_search)
    class FakeDB: pass
    called = {}
    monkeypatch.setattr(processor, "mark_failed", lambda db, tid: called.setdefault("failed", True))
    task = make_dummy_task()
    event = await processor.process_task(FakeDB(), task)
    assert event is None
    assert "failed" in called
@pytest.mark.asyncio
 async def test_choose_recommended_prefers_advanced(monkeypatch):
    # Lag tre SearchResult med ulike scorer
    m = make_dummy_metadata("mal")
    r1 = processor.SearchResult(simpleScore=10, prefixScore=10, advancedScore=90, sourceWeight=1.0, metadata=processor.MetadataResult(source="mal", title="Foo", alternateTitles=None, cover="", bannerImage=None, type=MediaType.MOVIE, summary=[], genres=[]))
    r2 = processor.SearchResult(simpleScore=50, prefixScore=50, advancedScore=20, sourceWeight=1.0, metadata=processor.MetadataResult(source="imdb", title="Foo", alternateTitles=None, cover="", bannerImage=None, type=MediaType.MOVIE, summary=[], genres=[]))
    r3 = processor.SearchResult(simpleScore=80, prefixScore=80, advancedScore=80, sourceWeight=1.0, metadata=processor.MetadataResult(source="anii", title="Foo", alternateTitles=None, cover="", bannerImage=None, type=MediaType.MOVIE, summary=[], genres=[]))
    recommended = processor.choose_recommended([r1, r2, r3])
    assert recommended is r1  # høyest advancedScore vinner
--- a/apps/pyMetadata/tests/test_repository.py
+++ b/apps/pyMetadata/tests/test_repository.py
@ -0,0 +1,135 @@
 import json
 import uuid
 from datetime import datetime
 import pytest
 from db import repository
 from models.event import MetadataSearchResultEvent, EventMetadata, SearchResult, MetadataResult, Summary
 from models.enums import MediaType, TaskStatus
 from db.repository import persist_event_and_mark_consumed
 from models.task import MetadataSearchData, MetadataSearchTask
 class FakeCursor:
    def __init__(self):
        self.executed = []
        self.rowcount = 1
    def execute(self, sql, params=None):
        self.executed.append((sql, params))
    def close(self): pass
 class FakeConn:
    def __init__(self):
        self.cursor_obj = FakeCursor()
        self.committed = False
        self.rolled_back = False
    def cursor(self, dictionary=False):
        return self.cursor_obj
    def commit(self): self.committed = True
    def rollback(self): self.rolled_back = True
 class FakeDB:
    def __init__(self):
        self.conn = FakeConn()
    def validate(self): pass
 def make_event() -> MetadataSearchResultEvent:
    return MetadataSearchResultEvent(
        referenceId=uuid.uuid4(),
        eventId=uuid.uuid4(),
        metadata=EventMetadata(
            created=datetime.now(),
            derivedFromId={uuid.uuid4()}
        ),
        results=[],
        recommended=SearchResult(
            simpleScore=1,
            prefixScore=2,
            advancedScore=3,
            sourceWeight=1.0,
            metadata=MetadataResult(
                source="test",
                title="title",
                alternateTitles=None,
                cover=None,
                bannerImage=None,
                type=MediaType.SERIE,
                summary=[Summary(language="en", description="desc")],
                genres=["action"]
            )
        ),
        status=TaskStatus.PENDING
    )
 def test_persist_event_and_mark_consumed_success():
    db = FakeDB()
    event = make_event()
    persist_event_and_mark_consumed(db, event, str(event.eventId))
    # verifiser at commit ble kalt
    assert db.conn.committed
    # verifiser at to SQL statements ble kjørt
    assert len(db.conn.cursor_obj.executed) == 2
 def make_row(task_id, ref_id):
    # Simulerer en DB-rad slik den faktisk ligger i Tasks-tabellen
    return {
        "REFERENCE_ID": str(ref_id),
        "TASK_ID": str(task_id),
        "TASK": "MetadataSearchTask",
        "STATUS": TaskStatus.PENDING.value,
        "DATA": json.dumps({
            "searchTitles": ["Foo", "Bar"],
            "collection": "anime"
        }),
        "CLAIMED": False,
        "CLAIMED_BY": None,
        "CONSUMED": False,
        "LAST_CHECK_IN": None,
        "PERSISTED_AT": datetime.now().isoformat()
    }
 def test_fetch_next_task_maps_correctly(monkeypatch):
    task_id = uuid.uuid4()
    ref_id = uuid.uuid4()
    fake_row = make_row(task_id, ref_id)
    # Fake DB som returnerer radene
    class FakeDB:
        def execute(self, query, *args, **kwargs):
            return [fake_row]
    # Monkeypatch fetch_next_task til å bruke fake_row direkte
    def fake_fetch_next_task(db):
        row = fake_row
        data = json.loads(row["DATA"])
        return MetadataSearchTask(
            referenceId=uuid.UUID(row["REFERENCE_ID"]),
            taskId=uuid.UUID(row["TASK_ID"]),
            task=row["TASK"],
            status=TaskStatus(row["STATUS"]),
            data=MetadataSearchData(
                searchTitles=data["searchTitles"],
                collection=data["collection"]
            ),
            claimed=row["CLAIMED"],
            claimedBy=row["CLAIMED_BY"],
            consumed=row["CONSUMED"],
            lastCheckIn=row["LAST_CHECK_IN"],
            persistedAt=datetime.fromisoformat(row["PERSISTED_AT"])
        )
    monkeypatch.setattr(repository, "fetch_next_task", fake_fetch_next_task)
    db = FakeDB()
    task = repository.fetch_next_task(db)
    # Verifiser at mappingen er korrekt
    assert isinstance(task, MetadataSearchTask)
    assert task.taskId == task_id
    assert task.referenceId == ref_id
    assert task.status == TaskStatus.PENDING
    assert task.data.collection == "anime"
    assert task.data.searchTitles == ["Foo", "Bar"]
    assert task.claimed is False
    assert task.consumed is False
--- a/apps/pyMetadata/tests/test_search_runner.py
+++ b/apps/pyMetadata/tests/test_search_runner.py
@ -0,0 +1,75 @@
 import asyncio
 import pytest
 import uuid
 from datetime import datetime
 from worker.search_runner import run_search
 from models.metadata import Metadata, Summary, MediaType
 # Dummy Metadata factory
 def make_dummy_metadata(source: str, title: str = "Dummy Title") -> Metadata:
    return Metadata(
        title=title,
        altTitle=[f"{title} alt"],
        cover="http://example.com/cover.jpg",
        banner=None,
        type=MediaType.MOVIE,  # bruk en gyldig enum fra din kode
        summary=[Summary(summary="A fake summary", language="en")],
        genres=["Drama", "Action"],
        source=source,
    )
 # Dummy Source that mimics SourceBase
 class DummySource:
    def __init__(self, titles, result=None, raise_exc=False):
        self.titles = titles
        self._result = result
        self._raise_exc = raise_exc
    async def search(self):
        if self._raise_exc:
            raise RuntimeError("Search failed")
        return self._result
@pytest.mark.asyncio
 async def test_run_search_all_results(monkeypatch):
    sources = [
        DummySource(["foo"], make_dummy_metadata("mal")),
        DummySource(["foo"], make_dummy_metadata("imdb")),
        DummySource(["foo"], make_dummy_metadata("anii")),
    ]
    monkeypatch.setattr("worker.search_runner.get_all_sources", lambda titles: sources)
    results = await run_search(["foo"])
    assert len(results) == 3
    assert all(isinstance(r, Metadata) for r in results)
    assert {r.source for r in results} == {"mal", "imdb", "anii"}
@pytest.mark.asyncio
 async def test_run_search_filters_none(monkeypatch):
    sources = [
        DummySource(["foo"], make_dummy_metadata("mal")),
        DummySource(["foo"], None),
        DummySource(["foo"], make_dummy_metadata("imdb")),
    ]
    monkeypatch.setattr("worker.search_runner.get_all_sources", lambda titles: sources)
    results = await run_search(["foo"])
    assert len(results) == 2
    assert {r.source for r in results} == {"mal", "imdb"}
@pytest.mark.asyncio
 async def test_run_search_handles_exception(monkeypatch):
    sources = [
        DummySource(["foo"], make_dummy_metadata("mal")),
        DummySource(["foo"], raise_exc=True),
        DummySource(["foo"], make_dummy_metadata("imdb")),
    ]
    monkeypatch.setattr("worker.search_runner.get_all_sources", lambda titles: sources)
    results = await run_search(["foo"])
    # Nå skal vi få bare de gyldige Metadata-resultatene
    assert all(isinstance(r, Metadata) for r in results)
    assert {r.source for r in results} == {"mal", "imdb"}
--- a/apps/pyMetadata/utils/init.py
+++ b/apps/pyMetadata/utils/init.py
--- a/apps/pyMetadata/utils/backoff.py
+++ b/apps/pyMetadata/utils/backoff.py
@ -0,0 +1,11 @@
 from utils.logger import logger
 import time
 def retry_delays():
    return [5, 15, 30, 60]
 def wait_with_backoff():
    for delay in retry_delays():
        logger.info(f"⏳ Venter {delay} sekunder...")
        time.sleep(delay)
        yield
--- a/apps/pyMetadata/utils/logger.py
+++ b/apps/pyMetadata/utils/logger.py
@ -0,0 +1,32 @@
 import logging
 import sys
 # ANSI farger
 COLORS = {
    "INFO": "\033[94m",    # blå
    "DEBUG": "\033[92m",   # grønn
    "WARNING": "\033[93m", # gul
    "ERROR": "\033[91m",   # rød
    "RESET": "\033[0m"
 }
 class ColoredFormatter(logging.Formatter):
    def format(self, record):
        levelname = record.levelname
        color = COLORS.get(levelname, COLORS["RESET"])
        prefix = f"[{levelname}]"
        message = super().format(record)
        return f"{color}{prefix}{COLORS['RESET']} {message}"
 def setup_logger(level=logging.INFO):
    handler = logging.StreamHandler(sys.stdout)
    formatter = ColoredFormatter("%(asctime)s - %(name)s - %(message)s")
    handler.setFormatter(formatter)
    logger = logging.getLogger()
    logger.setLevel(level)
    logger.handlers = [handler]
    return logger
 # Opprett global logger
 logger: logging.Logger = setup_logger()
--- a/apps/pyMetadata/worker/init.py
+++ b/apps/pyMetadata/worker/init.py
--- a/apps/pyMetadata/worker/poller.py
+++ b/apps/pyMetadata/worker/poller.py
@ -0,0 +1,59 @@
 import asyncio
 import time
 from typing import Optional
 import uuid
 from db.database import Database
 from db.repository import claim_task, fetch_next_task, mark_failed, persist_event_and_mark_consumed
 from models.event import MetadataSearchResultEvent
 from worker.processor import process_task
 from utils.logger import logger
 from config.database_config import DatabaseConfig
 from models.task import MetadataSearchTask, Task
 def run_iteration(db: Database, worker_id: str, poll_interval: int) -> tuple[int, int]:
    """
    Kjør én iterasjon av poller-loopen.
    Returnerer (sleep_interval, next_interval).
    """
    try:
        task: Optional[Task] = fetch_next_task(db)
        if task:
            if not isinstance(task, MetadataSearchTask):
                logger.warning(f"⚠️ Ukjent task-type {type(task)} for {task.taskId}, hopper over.")
                return poll_interval, poll_interval
            if not claim_task(db, str(task.taskId), worker_id):
                logger.info(f"⏩ Task {task.taskId} ble claimet av en annen worker.")
                return poll_interval, poll_interval
            logger.info(f"🔔 Fant task {task.taskId} ({task.task}), claimed by {worker_id}")
            try:
                event: MetadataSearchResultEvent = asyncio.run(process_task(task))
                if event:
                    persist_event_and_mark_consumed(db, event, str(task.taskId))
                    logger.info(f"✅ Task {task.taskId} ferdig prosessert")
                else:
                    logger.error(f"❌ Task returned nothing! {task.taskId}")
                    raise RuntimeError("process_task returned nothing!")
            except Exception as task_error:
                logger.error(f"❌ Task {task.taskId} feilet under prosessering: {task_error}")
                mark_failed(db, str(task.taskId))
            return poll_interval, 5  # sov med nåværende, reset til 5
        else:
            logger.debug("Ingen nye tasks.")
            return poll_interval, min(poll_interval * 2, 60)
    except Exception as e:
        logger.error(f"⚠️ Feil i worker: {e}")
        db.connect()
        return poll_interval, 5
 def run_worker(db: Database, shutdown_flag_ref=lambda: False) -> None:
    poll_interval: int = 5
    worker_id = f"worker-{uuid.uuid4()}"
    while not shutdown_flag_ref():
        sleep_interval, poll_interval = run_iteration(db, worker_id, poll_interval)
        time.sleep(sleep_interval)
    logger.info("👋 run_worker loop avsluttet")
    db.close()
--- a/apps/pyMetadata/worker/processor.py
+++ b/apps/pyMetadata/worker/processor.py
@ -0,0 +1,128 @@
 import uuid
 from datetime import datetime
 from tabulate import tabulate
 from models.metadata import Metadata
 from models.task import MetadataSearchTask
 from utils.logger import logger
 from models.event import (
    EventMetadata,
    MetadataSearchResultEvent,
    SearchResult,
    MetadataResult,
    Summary,
    TaskStatus,
    MediaType,
 )
 from worker.search_runner import run_search
 from algo.SimpleMatcher import SimpleMatcher
 from algo.PrefixMatcher import PrefixMatcher
 from algo.AdvancedMatcher import AdvancedMatcher
 from db.repository import mark_failed
 def source_priority(source: str) -> int:
    """Domene-spesifikk kildevekting."""
    priority_map = {'mal': 1, 'anii': 2, 'imdb': 3}
    return priority_map.get(source, 4)
 def score_metadata_against_title(title, m: Metadata) -> SearchResult:
    simple = SimpleMatcher(title, m).getScore()
    prefix = PrefixMatcher(title, m).getScore()
    advanced = AdvancedMatcher(title, m).getScore()
    # IMPORTANT: map exactly to bannerImage, not banner.
    metadata_result = MetadataResult(
        source=m.source,
        title=m.title,
        alternateTitles=m.altTitle if m.altTitle else [],
        cover=getattr(m, "cover", None),
        bannerImage=getattr(m, "bannerImage", None),  # no renaming
        type=m.type,  # must already be MediaType
        summary=[Summary(language=s.language, description=s.summary) for s in m.summary],
        genres=m.genres,
    )
    return SearchResult(
        simpleScore=simple,
        prefixScore=prefix,
        advancedScore=advanced,
        sourceWeight=1.0,
        metadata=metadata_result
    )
 def print_summary(results: list[SearchResult], titles: list[str]) -> None:
    """Print tabell med scorer for alle kombinasjoner."""
    rows = []
    for r in results:
        rows.append((
            # NB: metadata.title er matched title, search_title kan du lagre i SearchResult hvis du vil
            r.metadata.title,
            r.metadata.source,
            r.simpleScore,
            r.prefixScore,
            r.advancedScore
        ))
    headers = ["Matched Title", "Source", "Simple", "Prefix", "Advanced"]
    print(tabulate(rows, headers=headers))
 def choose_recommended(results: list[SearchResult]) -> SearchResult:
    """Velg recommended basert på scorer og kildevekting."""
    return max(
        results,
        key=lambda r: (
            r.advancedScore,
            r.simpleScore,
            r.prefixScore,
            -source_priority(r.metadata.source)
        )
    )
 async def process_task(db, task: MetadataSearchTask) -> MetadataSearchResultEvent|None:
    titles = task.data.searchTitles
    logger.info(f"Prosesserer task {task.taskId} med titler: {titles}")
    try:
        metadata_list = await run_search(titles)
        if not metadata_list:
            mark_failed(db, task.taskId)
            return
        # 1) Score alle kombinasjoner
        results = []
        for m in metadata_list:
            for t in titles:
                results.append(score_metadata_against_title(t, m))
        # 2) Print tabell
        print_summary(results, titles)
        # 3) Velg recommended
        recommended = choose_recommended(results)
        # 4) Bygg event
        core_metadata = EventMetadata(
            created=datetime.now(),
            derivedFromId={task.referenceId, task.taskId}
        )
        event = MetadataSearchResultEvent(
            referenceId=task.referenceId,
            eventId=uuid.uuid4(),
            metadata=core_metadata,
            results=results,
            recommended=recommended,
            status=TaskStatus.COMPLETED
        )
        # 5) Returner
        logger.info(f"✅ Task {task.taskId} ferdig prosessert med {len(results)} resultater")
        return event
    except Exception as e:
        logger.error(f"❌ Task {task.taskId} feilet: {e}")
        mark_failed(db, task.taskId)
        return None
--- a/apps/pyMetadata/worker/search_runner.py
+++ b/apps/pyMetadata/worker/search_runner.py
@ -0,0 +1,31 @@
 # search_runner.py
 import asyncio
 from typing import List
 from models.metadata import Metadata
 from utils.logger import logger
 from sources.factory import get_all_sources
 async def run_search(titles: List[str]) -> List[Metadata]:
    """
    Kjører alle kilder parallelt på gitt titler.
    Returnerer en liste av Metadata fra alle kilder.
    Ingen mapping eller scoring gjøres her.
    """
    sources = get_all_sources(titles)
    # Kjør alle kildesøk parallelt
    results = await asyncio.gather(*(s.search() for s in sources), return_exceptions=True)
    metadata_results: List[Metadata] = []
    for source, r in zip(sources, results):
        if isinstance(r, Exception):
            logger.warning(
                f"Kilde '{source.__class__.__name__}' feilet under søk "
                f"med titler={source.titles}: {r}"
            )
        elif r is not None:
            metadata_results.append(r)
    logger.info(f"Søk ferdig: {len(metadata_results)} resultater fra {len(sources)} kilder")
    return metadata_results
--- a/apps/pyWatcher/api/health_api.py
+++ b/apps/pyWatcher/api/health_api.py
@ -0,0 +1,19 @@
 from fastapi import FastAPI
 from fastapi.responses import JSONResponse
 def create_health_app(observers_ref):
    """
    Returnerer en FastAPI-app med /health endpoint.
    observers_ref: en funksjon eller lambda som gir listen av observers.
    """
    app = FastAPI()
    @app.get("/health")
    def health():
        observers = observers_ref()
        healthy = all(obs.is_alive() for obs in observers)
        status = "healthy" if healthy else "unhealthy"
        code = 200 if healthy else 500
        return JSONResponse({"status": status}, status_code=code)
    return app