Ausgabe 9

Benchmarking Digimodes – Eine Session auf dem Amateurfunk Barcamp 2018

Dieser Artikel erschien zuerst im Dezember 2018 in der gedruckten Ausgabe unseres Magazins.

In diesem Artikel möchte ich ein paar Überlegungen zum Thema Digimodes vorstellen und wie man diese quantitativ bewerten („benchmarken“) kann. Ich habe diese Ideen erstmalig auf dem Amateurfunk-Barcamp 2018 in Strausberg vorgestellt und mich aufgrund des dortigen Interesses entschieden, diesen Beitrag zu schreiben.

Schon immer haben mich digitale Übertragungsverfahren fasziniert. Seit Sommer diesen Jahres habe ich meine Amateurfunkprüfung abgeschlossen und konnte somit auch praktisch Experimente durchführen. Mit meinem ersten Kurzwellentransceiver, dem FT-450D, und verschiedenen selbstgebauten Drahtantennen habe ich allerdings zunächst im Sprechfunk Erfahrungen gesammelt. Obwohl mir trotz des Sonnenfleckenminimums auch einige wenige interkontinentale Sprechverbindungen möglich waren, konnte ich im anschließenden Betrieb mit Digimodes weitaus größere Entfernungen bei gleichen Funkbedingungen überbrücken. Auch bei Verbindungen über die Bodenwelle ermöglichten mir Digimodes noch Verbindungen, wo der Sprachkanal bereits versagte.

Die Qual der Wahl

Es gibt eine große Zahl verschiedener Digimodes, welche die Übertragung von Daten über einen analogen Kanal ermöglichen. In aller Munde ist derzeit FT8, auch deshalb, weil es unter schlechten Bedingungen oft noch gelesen werden kann. Doch dies hat seinen Preis: Eine Übertragung enthält nur eine Handvoll Zeichen und dauert dafür 15 Sekunden. Grundsätzlich gilt: Je mehr Informationen pro Zeit übertragen werden können sollen, umso größer die Anfälligkeit bei Störungen des Übertragungskanals z.B. durch Rauschen  dazu später mehr.

FT8 Betrieb zwischen LZ2SR und DL1PZ
Bei FT8 kann in 15 Sekunden neben den Rufzeichen nur wenig übertragen werden (hier z.B. der Locator „JO62“).

FT8 ist nur einer von vielen Digimodes, die alle Vor- und Nachteile haben. Um diese besser quantifizieren zu können, habe ich mich auf die Suche nach greifbaren Messwerten gemacht.

Das Signal-Rausch-Verhältnis (SNR)

Die erste Zahl, auf die man im Zusammenhang mit Digimodes und ihrer Robustheit gegen schlechte Funkbedingungen trifft, ist das sogenannte Signal-Rausch-Verhältnis (SNR), auch Signal-Rausch-Abstand genannt. Die Frage, ob ein Signal vom Empfänger gelesen werden kann, hängt nämlich nicht ausschließlich von der Stärke des Signals beim Empfänger ab, sondern viel mehr vom Verhältnis der Signalleistung zur Rauschleistung. Das heißt: Je gestörter der Kanal (also je mehr Grundrauschen beim Empfänger), umso stärker muss das Signal sein, damit es noch lesbar ist. Das Verhältnis von Signalleistungspegel zu Rauschleistungspegel bezeichnet man als Signal-Rausch-Verhältnis oder abgekürzt: SNR (vom englischen „signal noise ratio“).

Das SNR wird in der Regel in Dezibel angegeben; so bedeutet z.B. ein SNR von +6 dB, dass die Signalleistung vier mal so hoch ist, wie die Rauschleistung. Verdoppelt man am Transmitter die Sendeleistung, so steigt das SNR um 3 dB auf 9 dB an, da die Signalleistung erhöht wird und die Rauschleistung konstant bleibt. Das SNR steht somit in einem unmittelbaren Zusammenhang mit der Sendeleistung, wobei die empfangene Signalleistung eben relativ zur auf dem Kanal vorhandenen Rauschleistung betrachtet wird.

Diese Zusammenhänge sollten jedem Funkamateur bekannt sein. So lässt sich das SNR im Sprechfunk auch näherungsweise über das S-Meter leicht ablesen, wenn man den Pegel des Grundrauschens mit dem Pegel bei empfangenem Signal vergleicht: Beträgt der Abstand z.B. drei S-Stufen, so ist das SNR ungefähr gleich 3 \cdot 6\,\mathrm{dB} = 18\,\mathrm{dB}. (Dies stimmt allerdings nur näherungsweise, da das S-Meter bei empfangenem Signal nicht nur die Signalleistung, sondern die Summe von Rauschleistung und Signalleistung misst.)

S-Meter bei 5 und S-Meter bei 8
Wenn das S-Meter bei einem Signal von 5 auf 8 steigt, dann beträgt das Signal-Rausch-Verhältnis ungefähr 18 dB.

Die spektrale Rauschleistungsdichte

Möchte man ein Signal nur innerhalb eines kleinen Frequenzbereiches dekodieren, so lässt sich die Rauschleistung mittels eines Filters reduzieren. Dieser Umstand wird beispielsweise bei schmalbandigen CW-Filtern ausgenutzt. Vereinfacht betrachtet kann man sich das Rauschen als gleichverteilt über das gesamte Frequenzband vorstellen. Betrachtet man einen größeren Frequenzbereich (hohe Bandbreite), dann ist der Rauschpegel höher, als wenn nur ein Bereich kleiner Bandbreite betrachtet wird. Mathematisch lautet der Zusammenhang in diesem Modell wie folgt: N = N_0 \cdot B. Hierbei ist N die Leistung des (in der Regel störenden) Rauschens, B die betrachtete Bandbreite (z.B. 2500 Hz bei einem entsprechend mit 2500 Hz Bandbreite gefilterten SSB-Kanal) und N_0 die spektrale Rauschleistungsdichte, die angibt, wie viel Rauschleistung pro Hz empfangener Bandbreite aufgenommen wird.

Schmalband um jeden Preis?

Dieser Zusammenhang legt nahe, dass schmalbandige Digimodes vorteilhaft wären, da durch eine kleinere Bandbreite B die Rauschleistung N = N_0 \cdot B sinkt, und somit das SNR steigt. Doch der Anschein, dass hierdurch grundsätzlich ein Vorteil gewonnen werden kann, trügt, denn es gibt einen zusätzlichen entgegengesetzt wirkenden Effekt: Je kleiner die Bandbreite ist (ohne gleichzeitig auch die Datenrate zu reduzieren), umso schwerer  bis unmöglich  wird es, ein Verfahren zu erschaffen, das bei einem bestimmten SNR noch erfolgreich eine Dekodierung vornehmen kann. Beide Effekte wirken gegeneinander und im günstigsten Falle heben sich die beiden Effekte nahezu auf. Im schlechtesten Falle ist es bei zu geringer Bandbreite und feststehender Datenrate nicht mehr möglich, eine Übertragung bei einem bestimmten SNR durchzuführen. Gerade aus diesem Grunde benötigen Anwendungen mit hoher Datenrate (z.B. HAMNET) einen breitbandigen Kanal.

Das Shannon-Hartley-Gesetz

Das Shannon-Hartley-Theorem oder Shannon-Hartley-Gesetz ist eine theoretische Überlegung, die unter bestimmten Annahmen (ein Kanal werde nur durch gleichförmiges Rauschen gestört) angibt, wie viele Informationen pro Zeit über einen Kanal mit bestimmter Bandbreite bei einem gegebenen Signal-Rausch-Abstand übertragen werden können.

Die aus diesen Überlegungen hervorgegangene Formel lautet wie folgt:

    \[ C = B \cdot \log_2\left(1 + \frac{S}{N}\right) \]

Vortrag zum Shannon-Hartley-Gesetz auf dem AFu-Barcamp 2018

Hierbei stellt \frac{S}{N} das Signal-Rausch-Verhältnis und C die maximal mögliche Datenrate in Bit pro Sekunde dar. Viele Funkamateure sind vielleicht eher gewohnt in WPM (Worte pro Minute) zu rechnen. Es ist nicht einfach, eine klare Umrechnung zu finden, da es keinen einfachen Zusammenhang zwischen Bits/Bytes und Worten gibt. Abhängig von der verwendeten Sprache, dem verwendeten Zeichenumfang (z.B. Groß-/Kleinschreibung oder nur Großbuchstaben), etwaigen Kompressionsverfahren usw. gibt es verschiedene Möglichkeiten der Umrechnung. Im Folgenden sei 1\,\mathrm{Wort} = 36\,\mathrm{Bit} angenommen, so dass 1\,\mathrm{WPM} = 0,\!6\,\frac{\mathrm{Bit}}{\mathrm{s}} gelte.

Brutto oder Netto?

Je nach Kodierungsverfahren werden neben den reinen Nutzdaten oft noch zusätzliche Bits übertragen, die z.B. der Synchronisation oder Fehlererkennung dienen. Möchten wir Digimodes in Hinblick auf ihren praktischen Nutzen miteinander vergleichen, so sollten wir bei der Bewertung der Übertragungsgeschwindigkeit nur die Nutzdaten heranziehen. So werden bei FT8 in einem Durchgang zwar 174 Bit (brutto) übertragen, davon sind jedoch nur 75 Bit Nutzdaten (netto). Der Rest wird für Synchronisation, Fehlererkennung und Fehlerkorrektur benötigt. Diese notwendigen Maßnahmen machen FT8 nicht schneller, fließen jedoch trotzdem in unsere spätere Bewertung ein, denn sie führen zu einem niedrigeren SNR, bei dem eine Sendung noch gut lesbar ist, und somit zu einer besseren Bewertung des Verfahrens.

Vergleichbarkeit des SNR bei unterschiedlicher Bandbreite

Dem Shannon-Hartley-Gesetz folgend, hängt das für eine bestimmte Datenrate C mindestens notwendige Signal-Rausch-Verhältnis von der verwendeten Bandbreite ab. Wenn wir Digimodes in Hinblick auf ihre Störunempfindlichkeit bewerten wollen, ist das SNR jedoch ungeeignet, da unterschiedliche Digimodes unterschiedliche Bandbreiten aufweisen und ein benötigtes höheres SNR eines sehr schmalbandigen Digimodes ein unfaires Vergleichskriterium wäre, da dieser schmale Digimode am Ende aufgrund eines vorgeschalteten Filters bei gleichen Umgebungsbedingungen mit weniger Rauschleistung gestört wird. Ein höheres benötigtes SNR ist also bei Digimodes mit geringer Bandbreite unproblematisch(er).

Sinnvoller ist es, das Verhältnis \frac{S}{N_0} (also das Verhältnis von Signalstärke zu spektraler Rauschleistungsdichte) zu betrachten, welches ein bestimmter Digimode benötigt. Aus Amateurfunksicht ist die Einheit dieser Größe eher unhandlich, da S die Einheit \mathrm{Watt} und N_0 die Einheit \frac{\mathrm{Watt}}{\mathrm{Hz}} besitzt. Es ist also nicht einfach möglich, ein dimensionsloses Verhältnis anzugeben, das sich in Dezibel umrechnen ließe. Stattdessen bietet es sich an, das SNR bezogen auf einen 2500-Hz-Kanal anzugeben:

    \[ \mathrm{SNR}_{2500} = \frac{S}{N_0 \cdot 2500\,\textrm{Hz}} = \frac{S}{N} \cdot \frac{B}{2500\,\textrm{Hz}} \]

Betrachten wir ein Übertragungsverfahren, das einen 2500-Hz-Kanal verwendet, dann ist \mathrm{SNR}_{2500} eben genau gleich groß wie das SNR, also S geteilt durch N. Bei Verfahren, die entsprechend weniger Bandbreite benötigen, wird ein etwaiges höheres benötigtes SNR eines untersuchten Verfahrens durch einen kleineren Faktor B ausgeglichen, so dass wir einen für die Praxis vergleichbaren Wert erhalten, da ein Bandpass die Rauschleistung gegenüber einem 2500-Hz-Kanal entsprechend reduzieren wird.

Einfluss von Bandbreite und Geschwindigkeit

Da wir bereits wissen, dass die Rauschleistung N über den Faktor N_0 mit der Bandbreite B verknüpft ist (N = N_0 \cdot B), lässt sich das oben eingeführte Shannon-Hartley-Gesetz auch wie folgt darstellen:

    \[ C = B \cdot \log_2\left(1 + \frac{S}{N_0 \cdot B}\right) \]

Zusammen mit der weiter oben stehenden Definition für das \mathrm{SNR}_{2500} ergibt sich dann:

    \[ C = B \cdot \log_2\left(1 + \mathrm{SNR}_{2500} \cdot \frac{2500\,\mathrm{Hz}}{B}\right) \]

Es sollte angemerkt werden, dass es sich bei dieser Formel um ein theoretisches Maximum handelt, was die übertragbare Datenrate bei einer gegebenen Bandbreite und einem gegebenen Signal-Rausch-Verhältnis betrifft. Reelle Verfahren sind immer schlechter, wie später verglichen werden soll.

Dennoch lässt die Formel bereits Rückschlüsse auf grundlegende Zusammenhänge bei der Informationsübertragung zu. Die Bandbreite B taucht zweimal in der Formel auf: Einmal vorne vor dem Logarithmus, einmal hinten im Nenner. Durch eine Grenzwertbetrachtung lässt sich zeigen, dass selbst wenn man die Bandbreite beliebig erhöht (B \rightarrow \infty), C nicht beliebig groß bzw. \frac{S}{N_0} oder das \mathrm{SNR}_{2500} nicht beliebig klein wird (also die Sendeleistung nicht beliebig reduziert werden kann). Wir können uns also durch Erhöhung der Bandbreite nicht „erkaufen“, dass ein Verfahren bei beliebig kleinen SNRs noch funktioniert.

B wird erhöht, aber SNR2500 fällt nicht unter ca. 20,8 dB
Durch Erhöhung der Bandbreite lässt sich die benötigte Sendeleistung nicht beliebig absenken.

Hingegen ist es theoretisch möglich, durch beliebig langsame Verfahren (C \rightarrow 0) das benötigte SNR beliebig zu reduzieren. In der Praxis kennen wir dies z.B. bei Ultra-Slow-CW oder langsamen EME-Digimodes, die sehr lange brauchen um wenige Informationen zu übertragen, dafür jedoch mit einem sehr schlechten SNR auskommen.

Die Datenrate geht von 250 Hz gegen 0 Hz, dabei sinkt der SNR2500 auf minus unendlich.
Durch Verringern der Datenrate lässt sich das benötigte minimale Signal-Rausch-Verhältnis (und damit auch die Sendeleistung) zumindest theoretisch beliebig senken.

Der optimale Digimode

Mittels des Shannon-Hartley-Gesetzes und dem oben eingeführten \mathrm{SNR}_{2500} können wir nunmehr einen bestimmten Digimode mit einem hypothetischen, perfekten Digimode vergleichen. Somit gelingt es, einen konkreten Prozentwert anzugeben, der uns sagen kann, wie viel Prozent der theoretischen machbaren Datenrate (bei gegebener Bandbreite und benötigtem \mathrm{SNR}_{2500}) von einem Digimode erreicht wird. Ebenso können wir den von einem Digimode benötigten \mathrm{SNR}_{2500} ins Verhältnis zu dem theoretischen Optimum bei gegebener Bandbreite und tatsächlicher Datenrate setzen. Wir erhalten dann einen Dezibel-Wert, der angibt, um wie viel Empfindlichkeit sich ein Digimode (z.B. FT8) noch verbessern ließe bevor die mathematische/physikalische Grenze erreicht ist. Wie die noch folgenden Zahlenbeispiele zeigen, liegt dieser bei modernen Verfahren etwa in der Größenordnung von 10\,\mathrm{dB}.

Bandbreiteneffizienz

Ebenso lässt sich feststellen, welche Bandbreite theoretisch mindestens benötigt wird, um eine bestimmte Datenrate bei einem gegebenen \mathrm{SNR}_{2500} erreichen zu können. Vergleichen wir diese mit der Bandbreite eines bestimmten Digimodes, dann erhalten wir die Bandbreiteneffizienz, die sich ebenfalls als Prozentwert darstellen lässt. Wie wir weiter unten sehen werden, ist BPSK-31 mit seinen 31.25 Hz Bandbreite in Hinblick auf die genutzte Bandbreite um ein Vielfaches sparsamer als FT8, obgleich FT8 viele andere Digimodes in Hinblick auf Bandbreiteneffizienz dennoch schlagen kann.

Die Berechnung der minimal benötigten Bandbreite für eine bestimmte Datenrate bei gegebenem \mathrm{SNR}_{2500} ist nicht ganz trivial, da die Variable B in der Gleichung des Shannon-Hartley-Gesetzes zweimal vorkommt, davon einmal im Logarithmus. Eine Umformung nach B ist nicht einfach möglich, doch lässt sich B durch ein numerisches Approximationsverfahren ermitteln.

Ultra-Breitband, oder: Auf den Bezugsrahmen kommt es an

Wie bereits erwähnt, erlaubt auch eine unendliche Erhöhung der Bandbreite bei gegebener Datenrate keine beliebig kleinen Signal-Rausch-Verhältnisse. Dennoch sollte man (unnötig) breitbandige Übertragungsarten nicht per se verteufeln, denn eine größere Bandbreite bei gleicher Gesamtleistung eines Signals belegt zwar mehr Bandbreite, doch pro Frequenzbereich ist die auch die Leistung entsprechend geringer. Gelingt es einen Digimode zu entwickeln, bei dem sich durch geschickte Kodierung andere Sendungen nicht störender als Rauschen verhalten, dann wäre es die Störung der anderen Funkteilnehmer betreffend egal, wie breitbandig eine Sendung ist, denn die breiteren Sendungen hätten entsprechend weniger Signalleistungsdichte im Frequenzspektrum. Durch die höhere Bandbreite ließe sich jedoch bei gleichbleibender Störempfindlichkeit die Sendeleistung reduzieren, so dass am Ende das Band entlastet wird.

Unter der Hypothese, dass die Schmalbandigkeit eines Digimodes kein grundsätzlicher Vorteil ist, kann es Sinn machen, die bisherigen Überlegungen zur Bewertung der Datenrate und des \mathrm{SNR}_{2500} eines Digimodes so vorzunehmen, dass wir den Digimode nicht mit einem perfekten Digimode gleicher Datenrate und Bandbreite vergleichen, sondern für unseren Vergleich eine unendliche Bandbreite annehmen. Wir erhalten dann andere Werte. Es kommt also auf den Bezugsrahmen an, wenn wir Digimodes Anhand von Zahlen bewerten wollen.

Konkrete Zahlen und Diskussion auf dem Amateurfunk-Barcamp 2018

Vorstehende Überlegungen habe ich in einer spontanen Session auf dem Amateurfunk-Barcamp 2018 in Strausberg vorstellt. Da einiges Interesse bestand, habe ich mich motiviert gefühlt am zweiten Tag der Veranstaltung konkrete Zahlen zu präsentieren.

Die Ermittlung des \mathrm{SNR}_{2500}, bei dem eine hinreichend gute Lesbarkeit gegeben ist, ist keinesfalls eine einfache Aufgabe. Zum einen gibt es unterschiedliche Definitionsmöglichkeiten „guter“ Lesbarkeit in Hinblick auf die erfolgreiche Dekodierungswahrscheinlichkeit oder die Anzahl falsch empfangener Zeichen; zum anderen habe ich bei meiner Recherche im Internet nur wenige Informationen zu experimentellen Untersuchungen oder Erfahrungswerten finden können. Aus diesem Grunde sollen die in der abgedruckten Tabelle stehenden Zahlen lediglich als Rechenbeispiel dienen und keine abschließende Aussagen über die jeweiligen Verfahren treffen.

Rechenbeispiele

Rechenbeispiele und Berechnungsprogramm als PDF-Datei herunterladen

In der auf dem Barcamp entstandenen Diskussion wurde auch über die Grenzen des verwendeten Modells gesprochen. So handelt es sich bei einer Funkverbindung nicht um einen durch gaußsches weißes Rauschen gestörten Kanal, sondern es kann durch sich verändernde Schichten oder reflektierende Objekte zu Frequenz- oder Phasenverschiebungen oder plötzlichen Änderungen der Amplitude kommen. Insbesondere sind Störungen nicht immer über die Zeit gleichverteilt. Es wurde die Hypothese aufgestellt, dass insbesondere schmalbandige Digimodes anfällig bei Kommunikation über Raumwelle sein könnten.

Die hier verwendeten Zahlenbeispiele könnten durch die Ergebnisse von Messreihen ersetzt werden, bei denen (unter möglichst konstanten, aber realen Störbedingungen) die Sendeleistung sukzessive verringert wird, bis keine hinreichend gute Dekodierung mehr möglich ist.

Diskussion auf dem AFu-Barcamp 2018

Interessant war auch die von Andreas (DJ3EI) aufgebrachte Bemerkung, dass einige Digimodes bei gleicher Hüllkurvenspitzenleistung (PEP) eine niedrigere durchschnittliche Sendeleistung aufweisen. So wird bei BPSK-31 beim Umtasten der Phasen (was beim Senden einer logischen 0 passiert) auch die Amplitude moduliert, so dass die durchschnittliche Sendeleistung kleiner als die Hüllkurvenspitzenleistung ist. Dies sollte man natürlich bei der Interpretation eines notwendigen \mathrm{SNR}_{2500}-Wertes berücksichtigen: Ist die Sendeleistung vor allem durch einen maximalen PEP eingeschränkt, dann kann mit einer Funkanlage über die Zeit weniger Leistung erzeugt werden, wenn man in BPSK-31 oder THROBX sendet, als wenn man beispielsweise den Mode FT8 verwendet, der auf Frequenzumtastung bei gleichbleibender Amplitude basiert.

Fazit und Ausblick

Immer dann, wenn bei Digimodes vom Signal-Rausch-Abstand die Rede ist, sollte genau darauf geachtet werden, was gemeint ist: Bezieht sich die Angabe auf einen 2500-Hz- oder 3000-Hz-Kanal, oder ist das tatsächliche Verhältnis von Signalleistung zu Rauschleistung bei der verwendeten Bandbreite gemeint?

Störungen können unterschiedlichster Art sein. Beschränken wir uns in einer Modellbetrachtung auf gaußsches weißes Rauschen, dann ermöglicht uns das Shannon-Hartley-Gesetz einen absoluten Maßstab an die physikalischen Übertragungseigenschaften von Digimodes anzulegen.

Das, was derzeit technisch mit FT8 und ähnlichen Digimodes möglich ist, liegt erstaunlich nahe am theoretischen Optimum. Doch zur Bewertung eines Digimodes gehört mehr als die Betrachtung des möglichen Signal-Rausch-Verhältnisses bei gegebener Datenrate (und ggf. Bandbreite), denn verschiedene Digimodes können unterschiedlich resistent gegen verschiedene Arten von Störungen sein. Auch haben digitale Übertragungsverfahren bestimmte Attribute und praktische Vor- und Nachteile, die über die physikalischen Übertragungseigenschaften hinausgehen. Beispielsweise lassen sich folgende Eigenschaften untersuchen:

  • Rechenkomplexität der Decodierung (ggf. Notwendigkeit einer Uhrzeitsynchronisation)
  • Komplexität der Implementation (Wie einfach lässt sich ein Dekoder programmieren oder bauen?)
  • Welche Daten sind entsprechend des Standards übertragbar (Großbuchstaben, ASCII, Unicode-Text, Binärdaten, Meta-Informationen?) und welche Kompression wird standardmäßig verwendet
  • Gibt es frei verfügbare Software zur Nutzung des Digimodes, und wenn ja, auf welcher Plattform / für welche Systeme?
  • etc.

Auch wenn sich die Kombination von Geschwindigkeit und Robustheit nicht mehr beliebig steigern lässt, ist die Entwicklung von Digimodes keinesfalls am Ende. Es gibt in diesem Bereich noch viele Entdeckungen zu machen und vor allem auch noch vieles experimentell zu erforschen.

0 Kommentare zu “Benchmarking Digimodes – Eine Session auf dem Amateurfunk Barcamp 2018

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*