Wobei letztlich selbst dann das Problem bleibt, dass sich noch kein Standard für den Videocodec etabliert hat.
Bei den kostenlosen Apps und Windowsprogrammen setzen sich mehr oder weniger h.263+ und vp9 durch (lizenztechnisch günstig), auf kommerziellen Geräten h.264 (weils hardwaremäßig in einigen Chips bereits integriert ist).
Welche Auflösungen und Framerates unterstützt werden, ist noch ein anderes Thema. Schon ein GXV3140 und ein GXV3240 arbeiten da nicht optimal zusammen, man muss sich vorher auf einen kleinsten gemeinsamen Nenner einigen.
Was wirklich fehlt, ist eine kostenlose Software, die Codec-Translation (und ggf.Videokonferenz) kann. So wie es Asterisk bei Audio macht. Die Hardwareanforderungen wären da natürlich erheblich höher.
Momentan kann man daher fast nur intern SIP-Video nutzen, wobei "extern" über Sip-Uri oder Insellösungen wie IPVideotalk möglich ist, wenn die verwendete Konfiguration der Geräte hinreichend ähnlich ist.
Es gibt einen guten Grund, warum schon das GXV3140 skypetauglich ist. Die Nutzerbasis ist schlicht größer und hat keine Codecprobleme, weils eh vorgegeben ist.
Insofern gilt für mich:
Intern Sip-Video mit h.264, extern SIP-Audio, Videogespräche per Skype. Wäre nur schön, wenn Skype die Anmeldung mehrerer Geräte gleichzeitig zuließe. Momentan denke ich schon über eine Hardwarelösung nach, indem man Audio/VideoIn und Out vom GXV3240 mit einem GXV3500 koppelt. Klingelt das GXV3240, so soll das an den Asterisk signalisiert werden. Der prüft, ob er nicht gerade selbst das 3240 anruft. Wenn nicht, dann erstellt es ein Callscript Rundrufgruppe(ohne3240) und 3500. Nimmt man in der Rundrufgruppe ab, so müsste der Asterisk Skype auf Annahme schalten(wie das geht, müsste ich noch rausfinden, im zweifelsfall mit simmuliertem Tablet, dass auf Rufannahme klickt). So könnte man -mit reduzierter Bildqualität SkypeVideo auf Sip-Video konvertieren und sogar (Sipgate zu Simquadtat) als reinen Audiocall auf einem Handy ohne Internet annehmen.
Für VideoTFE->extern gibt es auch noch die Möglichkeit, direkt auf den Videodatenstrom zuzugreifen, die Kameras haben ja zwei Datenströme.
Linphone ist ja opensource, vieleicht findet sich jemand mit Androidkenntnissen, der die App so modifiziert, dass sie statt eines Kontaktbildes eine in den Kontakten gespeicherte "Homepage" anzeigt (wo man dann die URL zur IPcam hinterlegt). Dann bräuchte man nur Sip-Audio, das Bild würde von der Kamera zugeschaltet (und wäre vor der Rufannahme schon zu sehen). Noch besser wäre eine entspechende App für normale Telefonie, also eingehende Anrufe über die SIM. Dann hat man auf jeden Fall Ton und nur, wenn die Internetverbindung gut genug ist, auch das Bild dazu.
So eine Lösung würde auch den Einsatz einfacherer IPKameras ermöglichen bzw. die Trennung des Audiosystems vom Videosystem. Ist zwar einerseits ein Schritt zurück, andererseits aber eine Verbesserung, weil reine AudioTFE mit hervorragender Audioqualität billig machbar sind (z.B. Fritz!DingDong DECT).
Ganz nebenbei sähe man das Bild auch schon vor Rufannahme, was einem ermöglicht, Nichtanwesenheit zu simmulieren (z.B. wenn man sich mit der vielen Hardware so verschuldet hat, dass der Gerichtsvollzieher vor der Tür steht)
Ergänzung zum Audioproblem(Echo, Rückkopplung):
Ein Lösungsansatz aus einem anderen Thread finde ich hoch interessant. Confbridge kann ab Asterisk10 auch Video. In der zugehörigen .conf kann man einstellen, welcher Teilnehmer das Video liefert (z.B. immer erster Teilnehmer).
Damit kann man Audio und Videohardware trennen.
Vorgehensweise:
GS-Kamera macht Anruf an Asterisk. Audio ist auf mute gestellt.
Dies triggert ein Callfile, das einen Rundruf (Bildtelephone, schnurlose Telefone, Handys ...) startet und in die Konferenz einläd. Parallel wird ein zweites Callfile erstellt, mit dem die seperate Audio-TFE angerufen und in die Konferenz geholt wird. Dort kann man z.B. eine Doorline a/b verwenden oder auch eine selbstgebaute Fritz!DingDong DECT.
Ergebnis müsste dann eigentlich sein, das die GS-IPCam immer das Bild in der Konferenz liefert, die Sprachverbindung aber letztlich zwischen der gesonderten AudioTFE und dem (Bild)telefon zu stande kommt.
Eine Erweiterungsmöglichkeit wäre eventuell, dass sogar erst nur eine Verbindung zur Kamera hergestellt wird, man also nur das Bild sieht, und erst auf DTMF-Code die AudioTFE eingeladen wird. Da muss ich mich noch mit beschäftigen.
Zumindest für meinen Zweck(ich setze ja provisorisch eh eine DECT-TFE ein), dürfte das der schnellste und einfachste Weg sein, zum Ziel zu kommen.
Ich bin mir allerdings nicht sicher, ob die fertigen Pakete für Raspian Asterisk >= 10 haben bzw. Confbridge als Modul drin ist. Ich habe meinen Asterisk 13 ja mit allen Modulen (auch pjsip, mp3, bluetooth, was der eigentliche Grund fürs kompillieren war) selbst erzeugt.