aubib.de | Blog https://www.aubib.de/blog/ Tue, 11 Dec 2018 13:02:20 +0100 Tue, 11 Dec 2018 13:02:20 +0100 t3extblog extension for TYPO3 Bibliothek - hat der Begriff ausgedient? Jetzt abstimmen! Tue, 11 Dec 2018 11:27:00 +0100 https://www.aubib.de/blog/article/2018/12/11/bibliothek-hat-der-begriff-ausgedient-jetzt-abstimmen/ post-296 https://www.aubib.de/blog/article/2018/12/11/bibliothek-hat-der-begriff-ausgedient-jetzt-abstimmen/ Student/in Ein neuer Trend im Bibliothekswesen ist der, dass manche Bibliotheken nicht mehr Bibliothek genannt werden wollen... Bibliothek - hat der Begriff ausgedient? Jetzt abstimmen! by Student/in 11-12-18

Categories: Gedankensprünge

Ein neuer Trend im Bibliothekswesen ist der, dass manche Bibliotheken nicht mehr Bibliothek genannt werden wollen – beispielsweise heißt sich die Deutsche Zentralbibliothek für Medizin offiziell ZB MED - Informationszentrum Lebenswissenschaften. Doch wieso ist das so?

Mit dieser Fragestellung hat sich auch der Bibliothekar Michael Knoche auf seinem Blog auseinandergesetzt: Ein Argument für eine Umbenennung liegt auf der Hand – Bibliotheken sind heutzutage weit mehr als die „Bücheraufbewahrungsstätten“, für die sie früher oft gehalten wurden. Elektronische Medien, Datenbanken, Informationskompetenz, und so weiter. All das ist vom aktuellen Erscheinungsbild der Bibliotheken nicht mehr wegzudenken. Doch rechtfertigt dieser Gesichtspunkt alleine eine Umbenennungswelle?

Das Problem liegt nicht an der Wandlung der Aufgaben einer Bibliothek, sondern viel mehr am Image, das sich immer noch als leicht angestaubt zusammenfassen lässt. Es soll nicht darum gehen, krampfhaft einen neuen Begriff zu definieren, um Bibliotheken attraktiver zu machen – sie sind es schon, und genau das muss man den Leuten bewusst machen!

 

Doch jetzt seid Ihr gefragt – seht Ihr den Umbenennungstrend positiv oder nicht? Stimmt darüber ab! Falls ja – wie sollten sich Bibliotheken dann nennen? Ab damit in die Kommentare!

 

Sollten Bibliotheken sich umbenennen?
]]>
Sind wir nicht alle ein bisschen Kurator? Tue, 11 Dec 2018 10:00:00 +0100 https://www.aubib.de/blog/article/2018/12/11/sind-wir-nicht-alle-ein-bisschen-kurator/ post-297 https://www.aubib.de/blog/article/2018/12/11/sind-wir-nicht-alle-ein-bisschen-kurator/ Student/in "Kuratoren? Die gibt's doch nur in Museen!" Falsch! Jeder ist ein Kurator und gerade in Bibliotheken kann man diese Tatsache wunderbar nutzen. Über dieses spannende Thema berichtet Dr. Werner in... Sind wir nicht alle ein bisschen Kurator? by Student/in 11-12-18

Categories: Vortrag | Bibliothek

Jeder ist ein Kurator. Die Allermeisten wissen davon nur noch nichts.

Dr. Klaus Ulrich Werner, Leiter der Philologischen Bibliothek der Freien Universität Berlin, hält am 10. Dezember 2018 einen Vortrag für uns zum Thema „Bibliotheksnutzer als Kuratoren“.

Das Kuratieren von Ausstellungen nur im Museum und nur durch Fachleute hat eine Erweiterung erfahren: Nämlich das Kuratieren durch den Besucher selbst, nicht nur im Museum, sondern auch in anderen Einrichtungen. Neben Parks, Gärten, Zoos und wissenschaftlichen Einrichtungen wird auch schon fleißig in einer ganz bestimmten anderen Einrichtung durch Laien kuratiert. Nämlich – Ihr ahnt es schon – in der Bibliothek!

Die Benutzer kuratieren Bibliotheksräume und Bestand, sie kuratieren Wissen und Content, digital und analog und machen die Ergebnisse sichtbar und nutzbar für andere.

Das geht so: Die Menschen nutzen intensiv den Bestand einer bestimmten Bibliothek, sichten ihn, durchforsten ihn auf eine bestimmte Fragestellung hin oder nach einem Thema, das sie fesselt, und stellen ihr Ergebnis zusammen. Aktuelle gesellschaftliche Ereignisse können diese Fragestellung aufbringen oder auch Forschungsthemen. Das machen die Bibliotheksbenutzer sowieso ständig, stimmt. Aber sie behalten es in der Regel für sich. Beim Kuratieren dagegen wird die gefundene Auswahl für die anderen Besucher aufbereitet und präsentiert, entweder in einem von der Bibliothek zur Verfügung gestellten Raum oder digital. Eine Bibliographie zum Anfassen entsteht. Natürlich kann dabei der gesamte Bestand einbezogen werden, denn auch digitale Medien können im analogen Raum präsentiert werden, etwa auf Bildschirmen oder anderen Geräten.

Also liebe Benutzer: Voll rein in den Bestand mit Kreativität, Kreativität, Kreativität! Was seht Ihr im Bibliotheksbestand, was andere nicht sehen? Zeigt es! Denn „curation is inventing, experimenting, growing, taking risks, breaking rules, making mistakes, and having fun.“ Und das können nicht nur Fachleute.

Was wir heute noch gelernt haben: Wer in einer Bibliothek arbeitet, die aussieht, wie ein Gehirn, kommt offensichtlich auf spannende Ideen :-)

Vielen Dank dafür, Herr Dr. Werner!


Weiterführende Links:

Themenraum Zentral- und Landesbibliothek Berlin: Standort Amerika-Gedenkbibliothek

Sitterwerk Kunstbibliothek, Sankt Gallen, Schweiz

National Archives and National Library, Singapore

Benny Nemerofsky-Ramsay, Hekma and Duyves‘s Library and Huis de Pinto Library, Amsterdam, Niederlande
 

]]>
aubib.de goes semantic! Sun, 09 Dec 2018 11:27:00 +0100 https://www.aubib.de/blog/article/2018/12/09/aubibde-goes-semantic/ post-295 https://www.aubib.de/blog/article/2018/12/09/aubibde-goes-semantic/ Student/in Das Semantische Web - wir sind jetzt auch dabei und ehrlich: so kompliziert ist es gar nicht ;) aubib.de goes semantic! by Student/in 09-12-18

Categories: Gedankensprünge Projekt Fachliches

aubib goes semantic

tl;dr (too long; didn't read):
aubib.de ist jetzt so aufbereitet, dass Suchmaschinen die Inhalte auch verstehen und nicht nur anzeigen können!

 

 

Das Semantische Web - gehört hat es wohl schon jeder, meistens hat einem irgendjemand ehrfürchtig davon erzählt, ohne selbst so genau zu wissen, was das eigentlich ist. Dabei ist die Logik und der Sinn dahinter eigentlich recht simpel und vor allem für Bibliothekare, wenn man es genauer betrachtet, fast schon Routine!

 

1) Die Idee

Wieso funktionieren Bibliothekskataloge? Weil Bibliothekare jede Ressource in die Hand nehmen und (zu?) genau beschreiben, was es damit auf sich hat. Damit generieren wir Metadaten, Daten über das Medium also. Diese Daten kann man miteinander verknüpfen, wodurch wir zum Beispiel Filter nach Jahreszahlen, Autoren usw. anbieten können.
Die Idee des Semantischen Webs ist eigentlich eine ganz ähnliche, nur auf einem viel tieferen Level. Sinn ist es, nicht ganze Ressourcen zu beschreiben, sondern die Inhalte der Ressource direkt. Wenn auf einer Website also der folgende Satz steht: "Am Fachbereich wird viel zu viel über Katzen gesprochen! ( *hust* )", dann würde eine (Such)Maschine diesen Satz zwar crawlen können und möglicherweise sogar anzeigen, wenn ein Nutzer nach "Katze" sucht. Das basiert dann aber nur darauf, dass der Suchbegriff "Katze" auch in dem Satz vorkommt, VERSTEHEN kann die Maschine nicht, was eine Katze ist. Und da setzt Semantik an!

 

2) Oh mein Gott, wie cooool, wie geht das?

Man versucht also der Maschine zu erklären, was eine Katze ist. Dafür muss man erst einmal beschreiben, was ein Säugetier ist. Und dafür vielleicht, was ein Lebewesen ist? Solche Erklärungen kann man in einer "Ontologie" festlegen, die versucht, einen bestimmten Ausschnitt der Realität abzubilden, wie eine Klassifikation ja auch - nur eben feiner.
Eine Katze könnte man z.B. so verorten:
ETWAS > Lebewesen > Säugetier > Katzen
Und da wir uns in der Welt von HTML und XML-Tags bewegen, würde man den Satz in HTML so auszeichnen:

<p>Am Fachbereich wird viel zu viel über <span typeof="Katzen">Katzen</span> gesprochen! ( *hust* )</p>

Damit kann die Maschine erkennen, dass von einer "Katze" gesprochen wird und auch einordnen, dass eine Katze ein Lebewesen ist.
Natürlich kann man sowas noch spezifischer mit Attributen ausdrücken:

<p>Am Fachbereich wird viel zu viel über <span typeof="Katzen"> <span property="color">braune</span> Katzen</span> gesprochen! ( *hust* )</p>

Damit würde man ausdrücken, dass über BRAUNE Katzen zu viel gesprochen wird ( *hust* ), da es ja aber um alle Katzen geht, lassen wir das mal weg.
Das Format, in dem wir oben ausgezeichnet haben, nennt sich übrigens "RDFa", darüber hinaus gibt es aber auch noch andere, z.B. das momentan bevorzugte "JSON LD", in dem wir auch die meisten Inhalte auf aubib.de aufbereitet haben. Nur beim Blog musste auf RDFa zurückgegriffen werden, weil die Inhalte dynamisch und teilweise intern generiert werden - mit Sicherheit kann man im Nachheinein jedenfalls sagen: Der TYPO3-Blog ist nicht für's Semantic Web gedacht ;)
Übrigens, ausgestattet sind bei uns jetzt Home, Blog, Wie-, Wo-, HföD- und die Tipps&Tricks-Seite! Gerne im Quelltext stöbern!

 

3) Okay, bis grad fand ich's cool, aber nicht so ausführlich bitte.

Natürlich gibt es da noch einiges drumrum, man muss eine Ontologie auswählen ( für uns war das www.schema.org , weil die von den großen Suchmaschinen gemeinsam definiert wurde ),
viele Klassen und Attribute richtig definieren, aaaber kurz gesagt:
Die Möglichkeiten, die sich daraus ergeben sind immens! Google führt zum Beispiel einen "Knowledge Graph", in dem alle vorkommenden Konzepte aus dieser Ontologie miteinander verknüpft sind. Daraus entstehen z.B. die ausführlichen Suchergebnisse in der Box rechts. Würden wir unseren Satz von oben noch weiter auszeichnen und jemand nach dem Fachbereich googlen, könnte in der Box rechts zum Beispiel stehen: "Gesprächsthemen: viel zu viel über Katzen" - oder sowas ähnliches ;)
Und auch für die Wissenschaft kann das große Auswirkungen haben, mehr dazu zum Beispiel in diesem Blogbeitrag zum Thema Open Research Knowledge Graph an der TIB Hannover.

 

4) Naja, vielleicht schau ich's mir doch mal an?

Mit dem Google Structured Data Testing Tool kann man sehr gut arbeiten und korrigieren, hier zum Beispiel die Ansicht unseres Blogs: search.google.com/structured-data/testing-tool
Für den Einstieg müssen aber erstmal Tutorials zu Ontologien, RDF und JSON LD her, die hier sind ganz verständlich finde ich:

Linked Data & JSON LD: json-ld.org/learn.html
Structured Data: developers.google.com/search/docs/guides/intro-structured-data
Linked Data & schema.org-Ontologie: schema.org


Viel Spaß, und wie immer: Erfahrungen, Meinungen und Morddrohungen in die Kommentare! :)

]]>
In eigener Sache - Artikel erschienen! Fri, 07 Dec 2018 13:31:00 +0100 https://www.aubib.de/blog/article/2018/12/07/in-eigener-sache-artikel-erschienen-1/ post-294 https://www.aubib.de/blog/article/2018/12/07/in-eigener-sache-artikel-erschienen-1/ Student/in Werbung in eigener Sache - ein Artikel über aubib.de ist in der Zeitschrift "Forum Bibliothek und Information" erschienen! In eigener Sache - Artikel erschienen! by Student/in 07-12-18

Categories: Projekt Lesestoff

aubib.de-Banner

Wir unterbrechen diesen Blog für einen kurzen Werbeblock in eigener Sache:
Gestern ist in der neuen Ausgabe "Die grüne Bibliothek" der Zeitschrift "Forum Bibliothek und Information" unser Artikel über aubib.de erschienen!
Vielen Dank an die Redaktion und viel Spaß beim Lesen - gleich in der ZDB nach der nächsten Bibliothek schauen, die sie im Bestand hat, OpenAccess gibt's dann in 3 Monaten!

]]>
ORKG - The Open Research Knowledge Graph Fri, 07 Dec 2018 12:31:00 +0100 https://www.aubib.de/blog/article/2018/12/07/orkg-the-open-research-knowledge-graph/ post-293 https://www.aubib.de/blog/article/2018/12/07/orkg-the-open-research-knowledge-graph/ Student/in The ORKG is a very interesting project about semantics in scholarly journals! ORKG - The Open Research Knowledge Graph by Student/in 07-12-18

Categories: Gedankensprünge Projekt Praktikum | Inland

Das Logo des ORKG

In the last article I talked about OpenResearch.org, which is an interesting project. The ORKG, however, is one of the most ambitious projects I have ever heard about.

The idea behind it is to mark-up scientific papers, the concepts, problems and results described in them semantically, so that not only humans can read and understand them, but also machines and search engines. This would give the possibility to not only link papers to each other through metadata, such as authors, publishers or keywords, but to actually link the knowledge communicated in papers, i.e. their information content. What this project relies on, of course, is a certain amount of data, which is why the project team hopes to connect the ORKG with paper submission systems. Papers submitted to conferences or journals would thus semi-automatically contribute content, thus at last creating structured semantic representations that connect scientific knowledge and information, not only at a metadata level but also the level of content conveyed in papers.

Let’s stop here for a moment and dream a bit about what possibilities could such a graph enable. Well, users could search for actual topics, not only with keywords and through subject indexes, but search for the topic itself and get access to all related content! Moreover, graph visualization could support entirely new search instruments! Visual search through a mindmap-like structure gives a completely new dimension to information retrieval. Whatever you’re dreaming of, great times are ahead with this project.

BIG thanks to Markus Stocker and Yaser Jaradeh for giving me insight into a project that is most likely going to change the way we think about and handle scientific knowledge!

 

Further reading:

http://www.orkg.org 

https://blogs.tib.eu/wp/tib/tag/orkg/ 

]]>
OpenResearch Tue, 04 Dec 2018 20:43:00 +0100 https://www.aubib.de/blog/article/2018/12/04/openresearch/ post-290 https://www.aubib.de/blog/article/2018/12/04/openresearch/ Student/in Das OpenResearch Projekt zeigt die Bibliothek nicht als Ort von Büchern, sondern von genau dem Wissen, das die Community braucht! OpenResearch by Student/in 04-12-18

Categories: Projekt Praktikum | Inland

Logo des OpenResearch-Wikis

OpenResearch ist ein Projekt von der TIB Hannover. Im Prinzip ein Wiki für Konferenzen, Workshops, alle Arten von Veranstaltungen im wissenschaftlichen Bereich. Warum? Weil es eine wahnsinnige Anzahl von verschiedenen Events gibt, über die man als Wissenschaftler kaum mehr einen Überblick haben kann.
Aufgesetzt ist das Wiki mit einem Semantic MediaWiki - der Vorteil gegenüber einem herkömmlichen MediaWiki-System: die Daten werden semantisch aufbereitet. Das heißt konkret, dass Suchmaschinen und andere automatisierte Verfahren den Kontext und die Bedeutung des Wikis besser erfassen können, aber auch, dass statt statischen Wikiseiten Querys verbaut werden können, Seiten also in Echtzeit abgefragt werden. Zum Beispiel kann sich ein Nutzer im OpenResearch-Wiki ein Profil anlegen und angeben, welche Konferenzen er besuchen will. Wird eine dieser Konferenz im Wiki aufgenommen (hoffentlich mit den wichtigen Feldern zur Call for Papers Frist, Teilnahmegebühren etc.) wird beim Aufrufen des Profils der Kalender generiert und genau diese Daten abgefragt.

Der Sinn des Projekts liegt darin, dass Bibliotheken nicht Institutionen sind, die Bücher erfassen, sondern Wissen! Und dazu gehört es, Wissen und Information so aufzubereiten, dass wir unserer Community damit einen guten Service bieten - zum Beispiel mit leichterer Planung zu Konferenzen und Meetings.

 

Übrigens, mitmachen kann und soll jeder, wie es sich bei einem Wiki gehört, also Einladung zum Mitwerkeln, viel Zeit kostet das nicht und bietet der Wissenschaft in Zukunft hoffentlich einen unverzichtbaren Service aus der Bibliothek!

]]>
Gott, die Welt und Bayern. 100 Kostbarkeiten aus den regionalen... Fri, 30 Nov 2018 12:00:00 +0100 https://www.aubib.de/blog/article/2018/11/30/gott-die-welt-und-bayern-100-kostbarkeiten-aus-den-regionalen-staatlichen-bibliotheken-bayerns/ post-289 https://www.aubib.de/blog/article/2018/11/30/gott-die-welt-und-bayern-100-kostbarkeiten-aus-den-regionalen-staatlichen-bibliotheken-bayerns/ Student/in Na, neugierig? Auf dem Blog gibt´s mehr! Gott, die Welt und Bayern. 100 Kostbarkeiten aus den regionalen Staatlichen Bibliotheken Bayerns by Student/in 30-11-18

Categories: Führung | Bibliothek Ausstellung | Bibliothek

 

„Mehr Hybris geht nicht“, so betitelte die SZ ihren Artikel über die Ausstellung „Gott, die Welt und Bayern“, bei der die 10 bayerischen Regionalbibliotheken jeweils 10 ihrer wertvollsten Schätze in einer gemeinsamen Ausstellung in der Bayerischen Staatsbibliothek präsentieren.

Diese insgesamt 100 Schmuckstücke wollten auch wir uns nicht entgehen lassen und so machte sich unser Kurs 17/20 gemeinsam mit Herrn Gantert und Frau Werr auf den Weg zur BSB.

Dort wurden wir von einem der zwei Kuratoren, Herrn Dr. Lübbers, Leiter der staatlichen Bibliothek Regensburg und (vorübergehender) Leiter der staatlichen Bibliothek Neuburg sehr herzlich empfangen.

Einleitend berichtete er uns über die vierjährige (!) Planung zur Ausstellung, die Besonderheiten von Regionalbibliotheken, den Aufbau und die Namensgebung der Ausstellung.

Die Ausstellung, die jeder auch ohne Vorkenntnisse kostenlos besuchen kann, ist in drei Teile gegliedert: Mittelalter, frühe Neuzeit und Neuzeit, wobei wir aus Zeitgründen leider nur die Schmuckstücke zum Mittelalter und weniges der frühen Neuzeit betrachten konnten.

Mit der Einteilung lässt sich auch der Name erklären: im Mittelalter ist eher Theologisches relevant (Gott), während man sich in der (frühen) Neuzeit eher um weltliche Belange kümmert (Welt). Doch alle Ausstellungsstücke vereinigt eines: sie sind in Bayerischen Regionalbibliotheken zu finden.

Schon führte uns Herr Lübbers zu den Schmuckstücken der 1200-Jährigen Kulturgeschichte Bayerns.

Staunend betrachteten wir Bücher, Karten und Radierungen.

Neben dem „Lorscher Arzneibuch“ aus dem Jahr 800 (ca.), das zum Weltdokumentenerbe gehört, finden sich eine sogenannte „Gutenbergbibel“, eine „Schedel’sche Weltchronik“, verschiedene Blockbücher, die einzige erhaltene Radierplatte Albrecht Dürers oder eine über 50 kg schwere, schön bebilderte Ausgabe der Bibel.

Zu jedem Schmuckstück konnte Herr Lübbers eine oftmals amüsante Geschichte erzählen. Wir erfuhren über die Sage eines jungfräulichen heiligen Ehepaares, grausame Hexenmorde, die auf Büchern basieren, moderne Klosterregeln und nicht ganz so moderne Gesetzestexte.

Neben dem ganzen „alten Kram“ soll aber auch die Moderne nicht zu kurz kommen.

So kann man sich einen Teil der Ausstellung auch digital mit Erklärungsvideos zu den Schmuckstücken anschauen.

Darüber hinaus kann man in der Ausstellung virtuell durch in 3D abgebildete Bücher blättern.

 

Viel zu schnell mussten wir uns auch schon wieder von Herrn Lübbers verabschieden.

Wir bedanken uns bei Herrn Lübbers für die bereichernde Führung durch die interessante Ausstellung!

 

 

 

 

]]>
Abschlusstreffen des Teamprojekts zum Meyerhuber-Wondratschek-Archiv Mon, 26 Nov 2018 13:10:00 +0100 https://www.aubib.de/blog/article/2018/11/26/abschlusstreffen-des-teamprojekts-zum-meyerhuber-wondratschek-archiv/ post-288 https://www.aubib.de/blog/article/2018/11/26/abschlusstreffen-des-teamprojekts-zum-meyerhuber-wondratschek-archiv/ Dozent/in Na, neugierig? Auf dem Blog gibt´s mehr! Abschlusstreffen des Teamprojekts zum Meyerhuber-Wondratschek-Archiv by Dozent/in 26-11-18

Categories: Projekt

Website Archivtür

Am vergangenen Sonntag (25. November 2018) gab es vor Ort im Meyerhuber-Wondratschek-Archiv, ein Abschlusstreffen aller Beteiligten. Anwesend waren neben den Studierenden, die das Teamprojekt bearbeitet haben (Frau Jasmin Grönert, Frau Maike Ohde, Frau Magdalena Hager, Herr Johannes Queck und Herr Fabian Waßer), auch Herr Wolf Wondratschek, Herr Dr. Alfred Meyerhuber und vom Fachbereich Herr Dr. Klaus Gantert.

Das Treffen bildete jedoch nicht nur den offiziellen Abschluss des zu einem guten Ende gebrachten Teamprojekts – die Website des Projekts kann vermutlich schon in wenigen Tagen freigeschaltet werden –, vielmehr wurden bei diesem Arbeitstreffen bereits auch Möglichkeiten der konzeptionellen Weiterentwicklung des Archivs und der zugehörigen Plattform durch künftige Projekte diskutiert. Thematisiert wurden beispielsweise die mögliche Weiternutzung der Metadaten in anderen Kontexten, Fragen der Benutzung der Archivalien sowie zusätzliche Aspekte, z.B. die Erstellung einer umfassenden Personalbibliographie. Alle Beteiligten zeigten sich an einer solchen Weiterentwicklung in Zusammenarbeit von Archiv, Autor und Studierenden des Fachbereichs sehr interessiert.

Wir danken Herrn Dr. Meyerhuber sehr herzlich für die Einladung ins Archiv und Herrn Wondratschek für die Zeit und Mühe, die er für die Weiterentwicklung des Projekts aufgebracht hat sowie für die Wertschätzung, die er für die Leistung der Studierenden zum Ausdruck brachte.

]]>
Dürfen wir vorstellen? OXPath! Sun, 25 Nov 2018 14:32:00 +0100 https://www.aubib.de/blog/article/2018/11/25/duerfen-wir-vorstellen-oxpath/ post-287 https://www.aubib.de/blog/article/2018/11/25/duerfen-wir-vorstellen-oxpath/ Student/in Schon mal von OXPath gehört und wie diese Skriptsprache das Leben vereinfachen kann? Nein? Na dann ab, den Blogbeitrag lesen! Dürfen wir vorstellen? OXPath! by Student/in 25-11-18

Categories: Gedankensprünge Fachliches

Ein Mensch programmiert an einem Laptop

Schon einmal etwas von OXPath gehört? Nein? Eigentlich kein Wunder, ist nämlich nicht besonders bekannt. Das aber völlig zu unrecht, denn diese Skriptsprache kann einem, besonders jemandem in einer Bibliothek, das Leben ungemein vereinfachen!

 

Die Idee

Oftmals kommt man in die Situation, eine Menge Metadaten gewinnen zu wollen, z.B. um einen Überblick über das Programm eines kleinen Verlags zu erhalten oder für's Katalogisieren großer Mengen frei verfügbarer Titel im Internet, ohne für jeden einzelnen fünf Mal klicken zu müssen. Dabei hilft OXPath - und wie?

 

Das Konzept

OXPath ermöglicht eine standardisierte Abfrage von Webseiten in HTML und das Speichern relevanter Information z.B. in eine XML-Datei. Die Voraussetzung ist, dass die Daten, die man gewinnen will, auch standardisiert vorliegen. Um das ganze ein bisschen greifbarer zu machen, hier ein Beispiel:

An der UB Regensburg wird die Bayerische Bibliographie speziell für die Oberpfalz & Regensburg betreut. Interessant ist hier auch das Portal www.heimatforschung-regensburg.de , das eine eBibliothek mit ein paar hundert freien Aufsätzen enthält. Um das Katalogisieren dieser Artikel leichter zu machen konnte ich OXPath nutzen und die kompletten Metadaten
samt Link zum Dokument mal in eine Datei schmeißen. Mit einem Stylesheet (in XSLT) kann man das noch in eine halbwegs schöne Tabelle werfen und spart sich eine Menge Zeit beim Bearbeiten!

Wenn man das kompliziertere Zeug weglässt sieht die Überseite der eBibliothek in HTML so aus:

 

<div id="container">

    <p>
        <a href="LinkZumErstenEintrag">
            <em>Erster Eintrag</em>
        </a>
    </p>
    <p>
        <a href="LinkZumZweitenEintrag">
            <em>Zweiter Eintrag</em>
        </a>
    </p>
</div>

 

Und nach einem Klick auf einen Eintrag so:

 

<div id="content">
    <p>HierStehtDerTitel</p>
    <a href="Link">UndHierDerLink</a>
</div>
          

 


Etwas vereinfacht würde ein entsprechendes Skript zum Sammeln z.B. von Titel und Link in OXPath so aussehen:

 

doc('http://www.heimatforschung-regensburg.de/view/type/library.default.html')
(Um die eBibliothek aufzurufen)

//div[@id="container"]//p/a/em/{click/}
(Um auf jeden Eintrag in der eBibliothek zu klicken und die entsprechende Seite aufzurufen  )

//div[@id="content"]:<Eintrag>
(Pro Eintrag einen Tag "Eintrag" in der Ausgabedatei.xml erzeugen)
        [//div/p[1]/text()[1]:<Titel>]
        (Speichere den Titel in der Ausgabedatei.xml im Tag "Titel")
        [//div/a[1]:<Dokumentenlink=string(@href)>]
        (Speichere den Link zum Dokument in der Ausgabedatei.xml im Tag "Dokumentenlink" )

 

Die Ausgabedatei in XML würde dann etwa so aussehen:

 

<?xml version="1.1" encoding="UTF-8"?>

<results>
    <Eintrag>
        <Titel>HierStehtDerTitel</Titel>
        <Link>UndHierDerLink</Link>
    </Eintrag>
    <Eintrag>
        <Titel>HierStehtDerTitel</Titel>
        <Link>UndHierDerLink</Link>
    </Eintrag>
</results>
        

 


Und das war's! Natürlich war im echten Skript dann mehr Info dabei und die Pfade ein wenig komplizierter, das Prinzip bleibt dabei aber immer dasselbe: Gib den Pfad zu der Info an, die gespeichert werden soll und gib an, wie sie gespeichert werden soll.
(Natürlich kann es aber rechtliche Einschränkungen beim Harvesting solcher Datengeben, hier also aufpassen!)

 

Die Ausführung

Jetzt muss dieses Skript natürlich irgendwie gestartet werden. Das funktioniert nur auf einem Linux-Betriebssystem,
außerdem müssen eine aktuelle Java-Version und Firefox installiert sein.
Zusätzlich muss diese Datei heruntergeladen werden, die das Ausführen von OXPath ermöglicht:
sourceforge.net/projects/oxpath/files/oxpath-cli/
Zum Ausführen öffnet man ein "Terminal", fühlt sich kurz wie ein Hacker, und gibt dann folgendes Kommando ein:

 

java -jar oxpath-cli.jar   -q OXPathSkript.oxp        -f xml                   -o Ausgabedatei.xml
(OXPath mit Java starten)      (führe diese Datei aus)    (Speichern in XML)       (Speichern in diese Datei)

 


So, fertig, das Skript läuft und vor den eigenen Augen fängt der Computer an selbstständig zu werden, klickt auf jeden Eintrag, sammelt die Metadaten und das so lange, bis er alle hat. Die Ergebnisse sieht man dann in der Ausgabedatei.xml und kann sich das Leben leichter machen. Die Syntax zu lernen dauert nicht lange und außerdem gibt es ein fantastisches PDF mit allen Erklärungen.
Hilfreich ist auch, sich erstmal mit XPath (Sprache zum Navigieren in XML und HTML-Dokumenten) zu beschäftigen,
ein kurzes Tutorial gibt's auf w3schools.com.

 

Viel Spaß damit - eigene Erfahrungen gern in die Kommentare! :)

Luis

 

 

 

(Bild: CC0 Pixnio)

]]>
„Be open!“ - Hochschulbibliothek Ansbach Fri, 23 Nov 2018 16:37:00 +0100 https://www.aubib.de/blog/article/2018/11/23/be-open-hochschulbibliothek-ansbach/ post-286 https://www.aubib.de/blog/article/2018/11/23/be-open-hochschulbibliothek-ansbach/ Student/in Unsere Eindrücke aus der Hochschulbibliothek Ansbach! „Be open!“ - Hochschulbibliothek Ansbach by Student/in 23-11-18

Categories: Praktikum

Die Abbildung zeigt den lauten Lesesaal der Hochschlbibliothek Ansbach

"Be open!“ - Das war einer der wichtigsten Grundsätze, der nicht nur Studierenden in IK-Schulungen vermittelt wurde, sondern auch uns im Praktikum an der Hochschulbibliothek in Ansbach. Offen sein für Neues, sich nicht vor anderen Meinungen verschließen, Dinge ausprobieren und Gelegenheiten ergreifen. So hat Ansbach mittlerweile personallose Öffnungszeiten, einen 24h-Rückgabeautomaten, super Webinare (übrigens immer alleine!) und ein Veranstaltungskonzept, das sich sehen lassen kann. Dass Bibliotheken Angebote zu Kreativität machen, war uns auch neu, aber warum auch nicht?

Ein weiterer wichtiger Grundsatz: Es geht immer um den Menschen. Wer die Bibliothek betritt, soll sich willkommen fühlen. Das betrifft nicht nur die Studierenden, die ProfessorInnen oder SchülerInnen, die hier ein- und ausgehen, sondern vor allem und in besonderer Art das Personal.

Die vergangenen zwei Wochen hatten wir die Gelegenheit, einen Einblick in den Alltag dieser Bibliothek zu bekommen. Darunter war natürlich klassische Bibliotheksarbeit wie Katalogisierung, Erwerbung und Fernleihe, aber auch vieles darüber hinaus: Gremienarbeit in Bayern, Graphikdesign, Websitegestaltung und die Aufgaben in Leitungspositionen, das volle Programm.

Ansbach mag zwar eine kleine Hochschule mit einer kleinen Bibliothek sein, das heißt aber nicht, dass sie in einer anderen Liga spielt wie die Großen! :)

 

An dieser Stelle, vielen Dank an das gesamte Bibliotheksteam!

 

Christina & Tanja

]]>