Test piramidetv.py

kclauhk · kclauhk · commit 12d187ed07ad · 2025-01-14T13:44:30.000+08:00
diff --git a/yt_dlp/extractor/_extractors.py b/yt_dlp/extractor/_extractors.py
@@ -1567,7 +1567,6 @@
 )
 from .piramidetv import (
     PiramideTVChannelIE,
-    PiramideTVChannelURLIE,
     PiramideTVIE,
 )
 from .pixivsketch import (
diff --git a/yt_dlp/extractor/piramidetv.py b/yt_dlp/extractor/piramidetv.py
@@ -1,11 +1,6 @@
-import re
-
-from .common import InfoExtractor, SearchInfoExtractor
-from ..utils import (
-    parse_iso8601,
-    traverse_obj,
-    url_or_none,
-)
+from .common import InfoExtractor
+from ..utils import parse_iso8601, smuggle_url, unsmuggle_url, url_or_none
+from ..utils.traversal import traverse_obj
 
 
 class PiramideTVIE(InfoExtractor):
@@ -27,101 +22,83 @@ class PiramideTVIE(InfoExtractor):
         'url': 'https://piramide.tv/video/wcYn6li79NgN',
         'info_dict': {
             'id': 'wcYn6li79NgN',
-            'title': 'ACEPTO TENER UN BEBE CON MI NOVIA\u2026?',
+            'ext': 'mp4',
+            'title': 'ACEPTO TENER UN BEBE CON MI NOVIA\u2026? | Parte 1',
             'description': '',
             'channel': 'ARTA GAME',
             'channel_id': 'arta_game',
+            'thumbnail': 'https://cdn.jwplayer.com/v2/media/cnEdGp5X/thumbnails/rHAaWfP7.jpg',
+            'timestamp': 1703434976,
+            'upload_date': '20231224',
         },
-        'playlist_count': 4,
     }]
 
-    def _extract_video(self, video_id, fatal=True):
-        video_data = self._download_json(
-            f'https://hermes.piramide.tv/video/data/{video_id}', video_id, fatal=fatal)
-        formats, subtitles = self._extract_m3u8_formats_and_subtitles(
-            f'https://cdn.piramide.tv/video/{video_id}/manifest.m3u8', video_id, fatal=fatal)
-        video_dict = {
-            'id': video_id,
-            **traverse_obj(video_data, ('video', {
-                'id': ('id', {str}),
-                'title': ('title', {str}),
-                'description': ('description', {str}),
-                'thumbnail': ('media', 'thumbnail', {url_or_none}),
-                'channel': ('channel', 'name', {str}),
-                'channel_id': ('channel', 'id', {str}),
-                'timestamp': ('date', {parse_iso8601}),
-            })),
-            'formats': formats,
-            'subtitles': subtitles,
-            'webpage_url': f'https://piramide.tv/video/{video_id}',
-            'webpage_url_basename': video_id,
-        }
-        next_video_id = traverse_obj(video_data, ('video', 'next_video', 'id', {str}))
-        return video_dict, next_video_id
+    def _extract_video(self, video_id):
+        if video_data := self._download_json(
+                f'https://hermes.piramide.tv/video/data/{video_id}', video_id, fatal=False):
+            formats, subtitles = self._extract_m3u8_formats_and_subtitles(
+                f'https://cdn.piramide.tv/video/{video_id}/manifest.m3u8', video_id, fatal=False)
+            next_video = traverse_obj(video_data, ('video', 'next_video', 'id', {str}))
+            return next_video, {
+                'id': video_id,
+                'formats': formats,
+                'subtitles': subtitles,
+                'webpage_url': f'https://piramide.tv/video/{video_id}',
+                'original_url': f'https://piramide.tv/video/{video_id}',
+                **traverse_obj(video_data, ('video', {
+                    'id': ('id', {str}),
+                    'title': ('title', {str}),
+                    'description': ('description', {str}),
+                    'thumbnail': ('media', 'thumbnail', {url_or_none}),
+                    'channel': ('channel', 'name', {str}),
+                    'channel_id': ('channel', 'id', {str}),
+                    'timestamp': ('date', {parse_iso8601}),
+                })),
+            }
+        return None, {'id': video_id}
 
-    def _entries(self, video, video_id):
-        if video:
-            yield video
-        while video_id is not None:
-            video, next_video_id = self._extract_video(video_id, False)
-            if video.get('formats'):
-                yield video
-            video_id = next_video_id if next_video_id != video_id else None
+    def _entries(self, video_id):
+        visited = set()
+        while True:
+            next_video, info = self._extract_video(video_id)
+            yield info
+            if not next_video or next_video in visited:
+                break
+            visited.add(next_video)
+            video_id = next_video
 
     def _real_extract(self, url):
+        url, smuggled_data = unsmuggle_url(url, {})
         video_id = self._match_id(url)
-        video, next_video_id = self._extract_video(video_id)
-        if next_video_id and self._yes_playlist(video_id, video_id):
-            return self.playlist_result(self._entries(video, next_video_id),
-                **traverse_obj(video, {
-                    'id': ('id', {str}),
-                    'title': ('title', {str}, {lambda x: re.split(r'\s+\|?\s*Parte\s*\d', x,
-                                                                  flags=re.IGNORECASE)[0]}),
-                    'description': ('description', {str}),
-                    'channel': ('channel', {str}),
-                    'channel_id': ('channel_id', {str}),
-                }))
-        return video
+        if self._yes_playlist(video_id, video_id, smuggled_data):
+            return self.playlist_result(self._entries(video_id), video_id)
+        return self._extract_video(video_id)[1]
 
 
-class PiramideTVChannelURLIE(InfoExtractor):
+class PiramideTVChannelIE(InfoExtractor):
     _VALID_URL = r'https?://piramide\.tv/channel/(?P<id>[\w-]+)'
     _TESTS = [{
         'url': 'https://piramide.tv/channel/thekalo',
-        'playlist_count': 10,
+        'playlist_mincount': 10,
         'info_dict': {
             'id': 'thekalo',
-            'title': 'thekalo',
-        },
-    }]
-
-    def _real_extract(self, url):
-        if channel_id := self._match_id(url):
-            return self.url_result(url=f'piramidetvall:{channel_id}', url_transparent=True)
-
-
-class PiramideTVChannelIE(SearchInfoExtractor):
-    IE_NAME = 'PiramideTV:channel'
-    _SEARCH_KEY = 'piramidetv'
-    _TESTS = [{
-        'url': 'piramidetv5:bobicraft',
-        'playlist_count': 5,
-        'info_dict': {
-            'id': 'bobicraft',
-            'title': 'bobicraft',
         },
     }]
 
-    def _search_results(self, channel_id):
+    def _entries(self, channel_name):
         videos = self._download_json(
-            f'https://hermes.piramide.tv/channel/list/{channel_id}/date/100000', channel_id)
+            f'https://hermes.piramide.tv/channel/list/{channel_name}/date/100000', channel_name)
         for video in videos.get('videos', []):
             if video_id := video.get('id'):
-                yield self.url_result(f'https://piramide.tv/video/{video_id}',
+                yield self.url_result(smuggle_url(
+                    f'https://piramide.tv/video/{video_id}', {'force_noplaylist': True}),
                     **traverse_obj(video, {
+                        'id': ('id', {str}),
                         'title': ('title', {str}),
                         'description': ('description', {str}),
-                        'thumbnail': ('media', 'thumbnail', {url_or_none}),
-                        'channel': ('channel', 'name', {str}),
-                        'channel_id': ('channel', 'id', {str}),
+                        'webpage_url': ('id', {str}, {lambda v: f'https://piramide.tv/video/{v}'}),
                     }))
+
+    def _real_extract(self, url):
+        channel_name = self._match_id(url)
+        return self.playlist_result(self._entries(channel_name), channel_name)

Original file line number	Diff line number	Diff line change
`@@ -1567,7 +1567,6 @@`
`1567`	`1567`	`)`
`1568`	`1568`	`from .piramidetv import (`
`1569`	`1569`	`PiramideTVChannelIE,`
`1570`		`- PiramideTVChannelURLIE,`
`1571`	`1570`	`PiramideTVIE,`
`1572`	`1571`	`)`
`1573`	`1572`	`from .pixivsketch import (`