[SOT-Portal] Tagesschau

Meatwad

Aktives Mitglied
Mitglied seit
1 Sep 2006
Beiträge
1,587
Punkte für Reaktionen
0
Punkte
0
hi,
ich hatte die idee gehabt, immer die aktuelle tagesschau im SOT-portal zu haben. (es ist recht praktisch, wenn man mal nicht um 20uhr am fernseher ist.

aber jeden tag einen link reinsetzten? uff das ist aufwändig! also habe ich mich ein bisschen shclau gemacht und den videopodcast entdeckt. ich hatte also die idee die xml-datei zu pharsen und jeweils den neusten tagesschaulink rauszufiltern und das dann im portal zu haben. wäre auch alles kein problem, bisauf das hier: die videos sind alle h.264 codiert. ich habe es nicht getestet, aber ich glaube, dass der player im portal das nicht abspielen kann.


hat da jemand ne lösung für?
 
wir könnten auch die Tagesschau website parsen, müßte auch gehen. Ich habe gerade mit dem Client viel um die Ohren aber wir haben hier ja noch ein paar PHP "Freaks" dabei vielleicht hat jemand lust sich der Parsing geschichte anzunehmen.
 
KP wie das mit dem Direktlink aussieht, aber es gibt prinzipiell 2 Tagesschau Links - einer Livestream und einer immer die letzte 20:00 Uhr Tagesschau - verändert sicht dieser 20:00 Uhr Link immer? Bzw der Link zum Video? Der Link ansich bleibt ja gleich ;)
 
leider verändert sich der 20 Uhr link immer, aber ich denke mit parsen müßte man sogar dank des Archivs der Tagesschau auch die alten Sendungen hinbekommen
 
das prob ist beim pharsen der page halt, dass es ne koplexe regex-konstruktion geben wird - viel zu viel aufwand glaube ich. besser wärs, wenn wir so ne art rss-feed hätten.

oder halt, dass der player die codierung abspielen kann.
 
Es gibt sogar drei verschiedene Video-Streams: Den Live-Stream, wenn denn gerade eine Tagesschau läuft - den würde ich außen vor lassen.
Dann gibt es die letzte Tagesschau - wenn man den ersten Stream schon nicht sehen kann, muss man eien Viertelstunde warten, und dann ist sie hier zu finden.
Und dann gibt es noch die 20:00 Uhr Tagesschau - auch ältere.
Hierzu gibt es einen PodCast - das ist so ähnlich wie RSS - nur die Tags sind etwas anders- aber man kann das wunderbar parsen...
Lier der Link zum PodCast: http://www.tagesschau.de/export/video-podcast
 
den feed habe ich ja auch schon angesprochen, allerdings kann der player der im SOT-Portal ist, das nicht wiedergeben. deswegen wäre es halt irgendwie lobhaft, wenn der player das unterstützen würde, dann könnte man den podcast pharsen.
 
Kann mir bitte mal jemand sagen was es mit RSS und oder PodCasts pharsen auf sich hat, bzw. was pharsen ist?
Wikipedia kennt pharsen auch nicht, egal wie ich das schreibe.
Bin auf der Suche nach einer Möglichkeit Audio-PodCasts über SOT abzufragen und einbinden!? Weiß jemand ob und wie das geht?
sichfragenderweise, pEtEr
 
Das kann Wikipedia auch nicht kennen, da ein Tippfehler drin ist. richtig muss es parsen heißen. Und damit ist gemeint, dass man ein Programm schreibt, welches die Datei öffnet, den Inhalt analysiert und sich die Informationen heraussucht, die es braucht.
 
Und hier findet man's - nämlich unter Parser
 
hat da jemand ne lösung für das problem mit der codierung? oder gibts irgend ne möglichkeit den podcast in wmv zu konvertieren? am besten auf linuxbasis. dann würde ich soetwas realisieren
 
Ich habe noch nicht nachgesehen, aber bevor hier jemand umcodiert würde ich mal nachsehen, ob man aus dem Dateinamen im PodCast nicht den WMV-Dateinamen ermitteln kann. Die Dateien liegen ja schon fertig auf dem Tagesschau-Server.
 
die Lösung halte ich auch für wesentlich eleganter
 
Selbst wenn das nicht klappt ist es immer noch einfacher, die HTML-Seite zu parsen.

am Wochenende könnte ich mal schau'n - aber mit etwas Glück kommt mir jemand zuvor.
 
warum so ein Aufstand? einmal den Quelltext angucken und schon sieht man die Filenamen - Der Tag <enclosure> mit dem Attribut url= enthält die Links zu den jeweiligen mp4 Files - und ein xml parser ist bei php ja dabei :D
 
Ich will aber die wmv Files ;-), ich habe mal angefangen das über die REGEXP zu machen, aber ertsmal dem SOTClient mehr Zeit gewidmet
 
Sorry, aber ich hasse reguläre Ausdrücke. Aber vielleicht seid ihr mit meiner Variante auch einverstanden.

PHP:
	function getLastTagesschau()
	{
		$filebuffer=file_get_contents("http://www.tageschau.de/sendungen/");
		
		$start=strpos($filebuffer,"<input type=\"checkbox\"");
		$ende=strpos($filebuffer,">",$start+1);
		$checkbox=substr($filebuffer,$start,$ende-$start+1);

		$start=strpos($checkbox,"value=\"")+7;
		$ende=strpos($checkbox,"\" ",$start+1);
		$id=substr($checkbox,$start,$ende-$start);
		
		$link="http://streaming.tagesschau.de/bb/redirect.lsc?rewrite=http://www.tagesschau.de/styles/container/video/style_video_asx/0,,OID".$id."_RESms256,00.asx&content=content&media=ms";
		return $link;		
	}
 
@the_gateskeeper: okay, das ist echt super! danke.

das wist die letzte tagesschau. die letzten tagesthemen wären auchnoch gut zu haben, sowie eins wo nur die letzte tagesschau um 20:00 ist, wäre das möglich?

meinst du, du bekommst das hin?

dann würde ich das ganze auf meinem server uppen, per header() auf das content verweisen und dann würde ich den link ins portal machen.
 
Die anderen Sind nicht ganz so einfach. Wenn du die (fixe) URL http://www.tagesschau.de/sendungen/ eingibst landest du nämlich immer bei dem Player mit der letzten Sendung...

Aber ich schau mal was sich machen lässt.
Die URL ist eh immer die gleiche, bis auf eine 7stellige Nummer, die die entsprechende Sendung kennzeichnet.
Außerdem sind da noch infos zur Qualität drin, aber die habe ich fest auf "Breitbandverbindung" eingestellt
 

Statistik des Forums

Themen
246,056
Beiträge
2,245,210
Mitglieder
373,480
Neuestes Mitglied
Skyscraperfan
Holen Sie sich 3CX - völlig kostenlos!
Verbinden Sie Ihr Team und Ihre Kunden Telefonie Livechat Videokonferenzen

Gehostet oder selbst-verwaltet. Für bis zu 10 Nutzer dauerhaft kostenlos. Keine Kreditkartendetails erforderlich. Ohne Risiko testen.

3CX
Für diese E-Mail-Adresse besteht bereits ein 3CX-Konto. Sie werden zum Kundenportal weitergeleitet, wo Sie sich anmelden oder Ihr Passwort zurücksetzen können, falls Sie dieses vergessen haben.