Skip to content

Commit 7f565b7

Browse files
authored
Merge pull request #823 from flairNLP/deprecate-topics-funke
Update topics for `Funke`
2 parents 171079c + 0d606ba commit 7f565b7

File tree

11 files changed

+1022
-3
lines changed

11 files changed

+1022
-3
lines changed

src/fundus/publishers/de/funke.py

Lines changed: 6 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -81,7 +81,7 @@ def images(self) -> List[Image]:
8181
)
8282

8383
class V1_1(V1):
84-
VALID_UNTIL = datetime.date.today()
84+
VALID_UNTIL = datetime.date(2025, 10, 22)
8585

8686
_paragraph_selector = XPath(
8787
"//div[contains(@class,'article-body')]"
@@ -102,3 +102,8 @@ class V1_1(V1):
102102
_image_selector = XPath(
103103
"//img[contains(@class, 'lg:aspect-[16/9]') or not(contains(@class, 'aspect-[1/1]'))] | //figure/picture"
104104
)
105+
106+
class V1_2(V1_1):
107+
VALID_UNTIL = datetime.date.today()
108+
109+
_topics_selector = XPath("//a[@data-track-v2-parentlabel='Mehr lesen über'] ")

src/fundus/publishers/de/waz.py

Lines changed: 4 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -78,5 +78,7 @@ class V1_1(V1):
7878
_subheadline_selector = XPath("//div[@class='article-body'] / h3[not(text()='Auch interessant')]")
7979

8080
class V2(FunkeParser.V1_1):
81-
# It seems like WAZ was bought by Funke and now uses the same layout
82-
VALID_UNTIL = datetime.date.today()
81+
pass
82+
83+
class V2_1(FunkeParser.V1_2):
84+
pass

tests/resources/parser/test_data/de/BSZ.json

Lines changed: 304 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -400,5 +400,309 @@
400400
"Energie",
401401
"Berlin"
402402
]
403+
},
404+
"V1_2": {
405+
"authors": [
406+
"Dominik Bath",
407+
"Theresa Martus"
408+
],
409+
"body": {
410+
"summary": [
411+
"Berlin. Der Bundesdrogenbeauftragte erklärt, warum er die Dokumentation „berührend“ fand. Mit Blick auf die deutsche Rap-Szene äußert er einen Verdacht."
412+
],
413+
"sections": [
414+
{
415+
"headline": [],
416+
"paragraphs": [
417+
"Der Bundesdrogenbeauftrage Hendrik Streeck (CDU) hat die Netflix-Dokumentation „Babo – Die Haftbefehl-Story“, in der der Rapper Haftbefehl seinen Weg durch Sucht, Drogenszene, psychische Krisen und Entzug schildert, als wichtigen Impuls für die Debatte über Drogenkonsum gewürdigt. Die Dokumentation sei irgendwie berührend, „weil sie aufrichtig und ungeschminkt zeigt, was Sucht wirklich bedeutet – körperlich, psychisch und sozial“, sagte Streeck dieser Redaktion.",
418+
"„Haftbefehl spricht offen über Abhängigkeit, Scham, Absturz und Neubeginn. Das ist keine Heldengeschichte, sondern die Realität vieler Menschen, die in eine Sucht geraten. Man spürt, wie sehr eine Droge das Leben eines Menschen vereinnahmen kann – bis sie ihn buchstäblich konsumiert“, so Streeck weiter. Die Dokumentation entzaubere das „vermeintlich Glamouröse am Drogenkonsum“ und mache deutlich, „wie zerstörerisch er sein kann“. Gleichzeitig zeige der Film: „Sucht ist eine Krankheit – und man kann sie behandeln. Der Weg heraus ist schwer, aber er ist möglich.“"
419+
]
420+
},
421+
{
422+
"headline": [
423+
"Haftbefehl-Doku - Streeck mit Verdacht: „Teile haben definitiv ein Problem“"
424+
],
425+
"paragraphs": [
426+
"Streeck äußerte zugleich deutliche Sorge über Teile der deutschen Rap-Szene. „Genau weiß ich das natürlich nicht, aber vermuten würde ich: Teile haben definitiv ein Problem – vor allem mit Kokain“, sagte der CDU-Politiker. In vielen Songtexten werde der Konsum von Drogen „als Symbol für Erfolg, Stärke oder Freiheit inszeniert“. Das zeichne ein verzerrtes Bild. „Als Arzt sehe ich die andere Seite: Kokain macht abhängig, greift das Herz-Kreislauf-System an, verändert das Gehirn und kann schwere psychische Störungen auslösen“, warnte Streeck.",
427+
"Gerade für junge Menschen sei diese Darstellung riskant. „Wenn diese Realität im Rampenlicht ausgeblendet wird, entsteht ein gefährliches Bild – besonders für junge Fans, die ihre Idole nachahmen wollen“, sagte er. Drogenkonsum sei „alles andere als ein Ausdruck von Stärke, sondern versteckt oft die eigene Schwäche“. Umso wichtiger seien prominente Persönlichkeiten, die offen über Sucht sprächen: „Wenn Künstler, Sportler oder andere Idole das so deutlich aussprechen, kann das der unsäglichen Verherrlichung von Kokain und Co. viel entgegensetzen.“"
428+
]
429+
},
430+
{
431+
"headline": [
432+
"Haftbefehl: Streeck wünscht sich mehr solcher Einblicke"
433+
],
434+
"paragraphs": [
435+
"Die Netflix-Doku könne hier ein Wendepunkt sein. Streeck nannte sie „ausdrücklich klasse“ und äußerte die Hoffnung, „dass es nicht dabei bleibt“. Auch Debatten, das Format in Schulen zu zeigen, hält er für sinnvoll – mit klaren Einschränkungen: „Man muss das altersgerecht tun, aber ich halte es für eine wichtige Kommunikation auf Augenhöhe.“ Er sehe darin eine Chance für zeitgemäße Prävention: „Ich halte nicht viel davon, von oben herab zu sprechen. Popkultur erreicht Millionen – inklusive mir selbst.“",
436+
"Wünschenswert sei ein „positiver Ruck“ in der Szene. Mit Blick auf den immer wieder thematisierten Drogenkonsum betonte er: „Erstrebenswert ist daran genau gar nichts. Das kann man nicht grafischer klarmachen als durch Aykuts Mut, seine Geschichte so ehrlich zu erzählen“, sagte Streeck mit Blick auf Haftbefehls bürgerlichen Namen Aykut Anhan."
437+
]
438+
}
439+
]
440+
},
441+
"images": [
442+
{
443+
"versions": [
444+
{
445+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v1_1_200.jpeg",
446+
"query_width": "max-width:599",
447+
"size": {
448+
"width": 200,
449+
"height": 0
450+
},
451+
"type": "image/jpeg"
452+
},
453+
{
454+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v1_1_200.webp",
455+
"query_width": "max-width:599",
456+
"size": {
457+
"width": 200,
458+
"height": 0
459+
},
460+
"type": "image/webp"
461+
},
462+
{
463+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v1_1_400.jpeg",
464+
"query_width": "max-width:599",
465+
"size": {
466+
"width": 400,
467+
"height": 0
468+
},
469+
"type": "image/jpeg"
470+
},
471+
{
472+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v1_1_400.webp",
473+
"query_width": "max-width:599",
474+
"size": {
475+
"width": 400,
476+
"height": 0
477+
},
478+
"type": "image/webp"
479+
},
480+
{
481+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v4_3_400.jpeg",
482+
"query_width": "max-width:959",
483+
"size": {
484+
"width": 400,
485+
"height": 0
486+
},
487+
"type": "image/jpeg"
488+
},
489+
{
490+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v4_3_400.webp",
491+
"query_width": "max-width:959",
492+
"size": {
493+
"width": 400,
494+
"height": 0
495+
},
496+
"type": "image/webp"
497+
},
498+
{
499+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v4_3_600.jpeg",
500+
"query_width": "max-width:959",
501+
"size": {
502+
"width": 600,
503+
"height": 0
504+
},
505+
"type": "image/jpeg"
506+
},
507+
{
508+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v4_3_600.webp",
509+
"query_width": "max-width:959",
510+
"size": {
511+
"width": 600,
512+
"height": 0
513+
},
514+
"type": "image/webp"
515+
},
516+
{
517+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v16_9_600.jpeg",
518+
"query_width": "min-width:960",
519+
"size": {
520+
"width": 600,
521+
"height": 0
522+
},
523+
"type": "image/jpeg"
524+
},
525+
{
526+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v16_9_600.webp",
527+
"query_width": "min-width:960",
528+
"size": {
529+
"width": 600,
530+
"height": 0
531+
},
532+
"type": "image/webp"
533+
},
534+
{
535+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v1_1_800.jpeg",
536+
"query_width": "max-width:599",
537+
"size": {
538+
"width": 800,
539+
"height": 0
540+
},
541+
"type": "image/jpeg"
542+
},
543+
{
544+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v1_1_800.webp",
545+
"query_width": "max-width:599",
546+
"size": {
547+
"width": 800,
548+
"height": 0
549+
},
550+
"type": "image/webp"
551+
},
552+
{
553+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v4_3_800.jpeg",
554+
"query_width": "max-width:959",
555+
"size": {
556+
"width": 800,
557+
"height": 0
558+
},
559+
"type": "image/jpeg"
560+
},
561+
{
562+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v4_3_800.webp",
563+
"query_width": "max-width:959",
564+
"size": {
565+
"width": 800,
566+
"height": 0
567+
},
568+
"type": "image/webp"
569+
},
570+
{
571+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v1_1_1200.jpeg",
572+
"query_width": "max-width:599",
573+
"size": {
574+
"width": 1200,
575+
"height": 0
576+
},
577+
"type": "image/jpeg"
578+
},
579+
{
580+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v1_1_1200.webp",
581+
"query_width": "max-width:599",
582+
"size": {
583+
"width": 1200,
584+
"height": 0
585+
},
586+
"type": "image/webp"
587+
},
588+
{
589+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v16_9_1200.jpeg",
590+
"query_width": "min-width:960",
591+
"size": {
592+
"width": 1200,
593+
"height": 0
594+
},
595+
"type": "image/jpeg"
596+
},
597+
{
598+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v16_9_1200.webp",
599+
"query_width": "min-width:960",
600+
"size": {
601+
"width": 1200,
602+
"height": 0
603+
},
604+
"type": "image/webp"
605+
},
606+
{
607+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v16_9_1600.jpeg",
608+
"query_width": "min-width:960",
609+
"size": {
610+
"width": 1600,
611+
"height": 0
612+
},
613+
"type": "image/jpeg"
614+
},
615+
{
616+
"url": "https://img.sparknews.funkemedien.de/410384573/410384573_fc_1762438625_v16_9_1600.webp",
617+
"query_width": "min-width:960",
618+
"size": {
619+
"width": 1600,
620+
"height": 0
621+
},
622+
"type": "image/webp"
623+
}
624+
],
625+
"is_cover": true,
626+
"description": "Hendrik Streeck / Drogenbeauftragter",
627+
"caption": "Auch der Bundesdrogenbeauftragte hat sich die Dokumentation über den Rapper Haftbefehl angesehen: Diese zeige „aufrichtig und ungeschminkt“, was Sucht wirklich bedeute, so Hendrik Streeck.",
628+
"authors": [
629+
"FUNKE Foto Services",
630+
"Reto Klar"
631+
],
632+
"position": 1015
633+
},
634+
{
635+
"versions": [
636+
{
637+
"url": "https://img.sparknews.funkemedien.de/410390770/410390770_1762438625_v16_9_600.jpeg",
638+
"query_width": "max-width:599",
639+
"size": {
640+
"width": 600,
641+
"height": 0
642+
},
643+
"type": "image/jpeg"
644+
},
645+
{
646+
"url": "https://img.sparknews.funkemedien.de/410390770/410390770_1762438625_v16_9_600.webp",
647+
"query_width": "max-width:599",
648+
"size": {
649+
"width": 600,
650+
"height": 0
651+
},
652+
"type": "image/webp"
653+
},
654+
{
655+
"url": "https://img.sparknews.funkemedien.de/410390770/410390770_1762438625_v16_9_1200.jpeg",
656+
"query_width": "max-width:599",
657+
"size": {
658+
"width": 1200,
659+
"height": 0
660+
},
661+
"type": "image/jpeg"
662+
},
663+
{
664+
"url": "https://img.sparknews.funkemedien.de/410390770/410390770_1762438625_v16_9_1200.webp",
665+
"query_width": "max-width:599",
666+
"size": {
667+
"width": 1200,
668+
"height": 0
669+
},
670+
"type": "image/webp"
671+
},
672+
{
673+
"url": "https://img.sparknews.funkemedien.de/410390770/410390770_1762438625_v16_9_1600.jpeg",
674+
"query_width": "max-width:599",
675+
"size": {
676+
"width": 1600,
677+
"height": 0
678+
},
679+
"type": "image/jpeg"
680+
},
681+
{
682+
"url": "https://img.sparknews.funkemedien.de/410390770/410390770_1762438625_v16_9_1600.webp",
683+
"query_width": "max-width:599",
684+
"size": {
685+
"width": 1600,
686+
"height": 0
687+
},
688+
"type": "image/webp"
689+
}
690+
],
691+
"is_cover": false,
692+
"description": "BABO-The Haftbefehl Story Netflix",
693+
"caption": "Die Netflix-Doku „Babo – Die Haftbefehl-Story“ zeigt auch die Abgründe des Offenbacher Rappers.",
694+
"authors": [
695+
"Netflix",
696+
"PR"
697+
],
698+
"position": 1045
699+
}
700+
],
701+
"publishing_date": "2025-11-06 20:00:00+00:00",
702+
"title": "Streeck lobt Haftbefehl-Doku und warnt vor Kokain-Verherrlichung im Rap",
703+
"topics": [
704+
"Drogen",
705+
"Bundesregierung"
706+
]
403707
}
404708
}
51.1 KB
Binary file not shown.

0 commit comments

Comments
 (0)