Botanischer Garten und Botanisches Museum, 2k

Biodiversitätsinformatik / Biodiversity Informatics
Botanischer Garten und Botanisches Museum Berlin-Dahlem

MoreTax

Mathematisch-abstrakte Darstellung des Informationsflusses innerhalb eines "potential Taxon"-Graphs

INHALT:  Die Ausgangssituation | Formale Beschreibung der zugrundeliegenden Struktur | LösungsansatzBedingungen

Die Ausgangssituation

In der Biologie bezeichnet man als Taxon (pl. Taxa) eine Gruppe von Organismen, die auf Grund ihrer gemeinsamen Abstammung bzw. ihrer Ähnlichkeit (nach verschiedenen Kriterien) zusammengefasst werden. Eine Vielzahl von Sachdaten, die sich in unabhängigen über die Welt zerstreute Quellen (Literatur, Datenbanken, usw.) befinden,  sind an Taxonnamen gekoppelt und können über diese verknüpft werden. 

Erhebliche Schwierigkeiten dieses Wissen zusammenzuführen entstehen dadurch, dass oft in den verschiedenen Quellen unterschiedliche Auffassungen über die geltende Systematik/Klassifikation (d. h. auch über den zu benutzenden Taxonname, da dieser nach festgelegten Nomenklaturregeln diese Klassifikation miteinbeziehen muss) und/oder über die Umschreibungen einzelner Taxa (d. h. die implizite Liste der zu einem Taxon gehörenden Organismen) vertreten werden. Die Frage nach der Übertragbarkeit von Sachdaten, die an einem Taxonnamen aus einer Quelle gekoppelt sind, zu Taxonnamen aus einer anderen Quelle ist Gegenstand des Forschungsprojekts „MoreTax“. Eine Auffassung über einen Taxon in einer besonderen Quelle kann formal durch die Kopplung des benutzten Taxonnamens mit dem Quellenhinweis bezeichnet werden. Eine solche Kopplung nennen wir „potential Taxon“. Ein spezieller im „MoreTax“ Projekt konzipierter Editor (der taxonomische Editor) hat die Funktion, einerseits diese „potential Taxa“ aus verschiedenen Quellen aufzunehmen und andererseits einem Experten(-team) zu ermöglichen, die nach seiner Meinung existierenden Mengenbeziehungen zwischen den diesen „potential Taxa“ nach der jeweiligen Auffassungen zugrunde liegenden Umschreibungen der Taxa festzuhalten.

ZURÜCK

Formale Beschreibung der zugrundeliegenden Struktur

Wir definieren:

M = {M1, ......, Mn}, wobei Mi Mengen sind, deren Elementesliste unbekannt ist. 

Mi stellt ein „potential Taxon“ dar.

P Ì M x M.

P ist die Menge von „potential Taxa“ -Paaren, welchen ein Experten(-team) eine Mengenbeziehung zugeordnet hat. Da eine Meinung über ein Paar (Mi, Mj) implizit eine Meinung über das Paar (Mj, Mi) beinhaltet, gilt:
(Mi, Mj) Î P Û (Mj, Mi) Î P.

V = {V1, ......, V64}, wobei Vi 6-Tupel sind, deren Komponente nur die Werte 0 oder 1 bzw. „falsch“ oder „wahr“ annehmen können.

Vi stellt eine „subjektive“ (im Sinne einer Expertenmeinung) Mengenbeziehung zwischen zwei „potential Taxa“ dar.
Die ersten 5 Komponenten beschreiben jeweils die Beziehung „kongruent“, „enthalten in“, „enthält“, „überlappen sich“ und „disjunkt“. Die letzte Komponente beschreibt eine „Unsicherheit“ des Experten über seine eigene Meinung.

Eine Funktion f : P ® V.

f  stellt die Expertenmeinung dar.

Man kann diese Struktur als Graph darstellen, in dem man M als Knotenmenge und P als Gerichtetensenkenmenge interpretiert. V ist dann als Gewichtungen oder Bewertungen der Senken zu betrachten.

 

Zyklen können in dieser Art von Graph auftreten.

Gesucht wird eine Funktion g : M x M ® V , die aus f , aus der Grapharchitektur und aus der - für V vorausgesetzten - Mengenlehre hergeleitet wird.

g soll die gerichtete Mengenbeziehung zwischen zwei beliebigen „potential Taxa“ Mq und Mz ermitteln, die dadurch entsteht, dass man von Mq zu Mz entlang der Senken des Graphs „reist“ und dabei die mengentheoretischen Interpretationen der „befahrenen Strecken“ miteinander verknüpft.

ZURÜCK

Lösungsansatz

1. Schritt:

Definiere eine Funktion h : V x V ® V so, dass

(f (Mi, Mj) = Vij Ù f (Mj, Mk) = Vjk) Þ h (Vij, Vjk) = Vik, wobei Vik die Mengenbeziehung zwischen Mi und Mk ist, die aus der Mengenlehre und den Mengenbeziehungen Vij (zwischen Mi und Mj) und Vjk (zwischen Mj und Mk) hergeleitet wird.

Wenn also (M1, M2) Î P und (M2, M3) Î P, kann folgender Term
h (f (M1, M2), f (M2, M3))
ausgewertet werden.

2. Schritt:

Definiere einen Algorithmus, der für (Mq, Mz) Î M x M die Menge Wqz aller Wege zwischen Mq und Mz ermittelt. Dabei gilt:

WqzÎ Wqz Û (Wqz = (Mr1, ......, Mrf) Ù Mr1 = Mq Ù Mrf = Mz Ù
"i,j Î (1, ...., f) (Mri = Mrj Þ i = j) Ù
"i Î (1, ...., f-1) (Mri, Mr(i+1)) Î P)

Wir nennen W die Menge aller Wege im Graph.

3. Schritt:

Definiere eine Funktion h’ : W ® V so, dass

(W = (M1, M2) Î W ) Þ h’ (W) = f (M1, M2) und
(W = (M1, ......, Mn) Î W ) Þ h’ (W) = h (.....(h (f (M1, M2), f (M2, M3)),.....), f (Mn-1, Mn))

4. Schritt:

Definiere zunächst eine Ordnung O Ì V x V innerhalb V so, dass

O(Vi, Vj) Û (k<6 Þ (bik £ bjk)),
wobei Vi = (bi1,....,bi6) und Vj = (bj1,....,bj6).

Definiere dann eine Funktion h* : V x V ® V so, dass

h* (Vi, Vj) = Vk Û (((bi6 = 0 Ù bj6 = 1) Þ (Vk = Vi)) Ù
((bi6 = 1 Ù bj6 = 0) Þ (Vk = Vj)) Ù
((bi6 = bj6) Þ ((bk6 = bi6) Ù O(Vk, Vi) Ù O(Vk, Vj) Ù
                        ((O(Vl, Vi) Ù O(Vl, Vj)) Þ O(Vl, Vk))))

Diese Funktion ermittelt die resultierende Mengenbeziehung zwischen zwei „potential Taxa“ aus einem engen Konsens zwei verschiedener Expertenmeinungen über die Mengenbeziehung zwischen denselben „potential Taxa“.

Definiere dann auch eine Funktion h** : V x V ® V so, dass

h** (Vi, Vj) = Vk Û (((bi6 ¹ bj6) Þ (bk6 = 1)) Ù ((bi6 = bj6) Þ (bk6 = bi6)) Ù
O(Vi, Vk) Ù O(Vj, Vk) Ù ((O(Vi, Vl) Ù O(Vj, Vl)) Þ O(Vk, Vl))))

Diese Funktion ermittelt die resultierende Mengenbeziehung zwischen zwei „potential Taxa“ aus einem breiten Konsens zwei verschiedener Expertenmeinungen über die Mengenbeziehung zwischen denselben „potential Taxa“.

5. Schritt:

Schließlich definiere die Funktion g : M x M ® V so:

(Wqz = {W1}) Þ (g (Mq, Mz) = h’ (W1)) und
(Wqz = {W1, ......, Wn}) Þ (g (Mq, Mz) = h* (......(h* (h’ (W1), h’ (W2)),.....), h’ (Wn)))

für den Fall enger Konsens,

oder so:

(Wqz = {W1}) Þ (g (Mq, Mz) = h’ (W1)) und
(Wqz = {W1, ......, Wn}) Þ (g (Mq, Mz) = h** (......(h** (h’ (W1), h’ (W2)),.....), h’ (Wn)))

für den Fall breiter Konsens.

ZURÜCK

Bedingungen

Für die Konsistenz der Auswertungen müssen folgende Bedingungen gelten.

Kommutativität:

  • h* (Vi, Vj) = h* (Vj, Vi)

  • h** (Vi, Vj) = h** (Vj, Vi)

Assoziativität:

  • h (h (Vi, Vj), Vk)) = h (Vi, h (Vj, Vk))

  • h* (h* (Vi, Vj), Vk)) = h* (Vi, h* (Vj, Vk))

  • h** (h** (Vi, Vj), Vk)) = h** (Vi, h** (Vj, Vk))

Distributivität:

  • h (h* (Vi, Vj), Vk) = h* (h (Vi, Vk), h (Vj, Vk))

  • h (h** (Vi, Vj), Vk) = h** (h (Vi, Vk), h (Vj, Vk))

  • h (Vi, h* (Vj, Vk)) = h* (h (Vi, Vj), h (Vi, Vk))

  • h (Vi, h** (Vj, Vk)) = h** (h (Vi, Vj), h (Vi, Vk))

Zur Vervollständigung und Vereinfachung werden drei zusätzlichen Funktionen definiert:

f’ : V ® V

f’ (V1) = V2 gdw V2 die gerichtete Mengenbeziehung zwischen Mj und Mi ist, die aus der gerichteten Mengenbeziehung V1 zwischen Mi und Mj entsteht.

f’’ : V ® V so, dass

f’’ (V1) = V2 Û ((i<6 Þ (bi ¹ ai)) Ù b6 = a6),
wobei V1 = (a1,....,a6) und V2 = (b1,....,b6).

g’ : V ® B

g’ ordnet jeder Mengenbeziehung Vi eine qualitative Bewertung Bj Î B bezüglich der Übertragbarkeit von Sachdaten von einem „potential Taxon“ M1 zu einem anderen M2, wenn Vi. die gerichtete Mengenbeziehung zwischen M1 und M2 ist.

ZURÜCK

Marc Geoffroy, August 2001

__________________________________________________________________________

 

MoreTax (Modellierung von regelbasierten Funktionalitäten) ist ein vom
Bundesamt für Naturschutz (BfN) finanziertes  Forschungs- und Entwicklungsvorhaben 

Projektleiter: Walter Berendsohn
Wissenschaftlicher Mitarbeiter: Marc Geoffroy

Diese Seite wurde zuletzt am 21-02-2002 geändert

Abt. Biodiversitätsinformatik /
Dept. of Biodiversity Informatics
BGBM 
Index

© Freie Universität Berlin, Botanischer Garten und Botanisches Museum Berlin-Dahlem,
Seitenverantwortlicher / Page editor: M. Geoffroy.     BGBM Impressum / Imprint