Skip to content

Release notes v0.6.1

danielmarreirosdeoliveira edited this page Jan 16, 2014 · 1 revision

Neues Release (061) der DA-NRW Software Suite

Liebe Administratoren, liebe Betreiber, liebe Interessierte,

wir stellen die Version 0.6.1 Sprockhövel der DA-NRW Software Suite vor!

Um die neuen Features hinsichtlich der URN-Behandlung zu ermöglichen und das Gesamtsystem intern schlüssiger und wartbarer zu halten, wurde in der neuen Version das interne Datenmodell ausdrucksstärker gestaltet. Es ist nun vollständig objektbasiert anstatt wie bisher packagebasiert ausgerichtet und gleichzeitig wurde eine scharfe Trennung von Objektidentifier und URN herbeigeführt.

Dies hat für den Betrieb der Software folgende Konsequenzen:

  • Die Ansicht der Jobs in der DA-WEB zeigt anstelle der Package-id den Objekt-Identifier.
  • Die Logs sind nun unter ContentBroker/log/object-logs/.log zu finden.
  • Die in Verarbeitung befindlichen Objekte finden sich auf der WorkArea unter fork//
  • Die DIPs werden als .tar ausgeliefert.

Die Version beinhaltet weiterhin folgende Änderungen:

Features SIP-Builder

  • Lücken in der Erfüllung des BagIt-Standards nun vollständig geschlossen
  • DDBexclusion-Option hinzugefügt
  • CLI-Version liefert Fehlercodes zurück
  • Verbessertes Management temporärer Daten

Benutzer-Schnittstelle / DA-WEB

  • DA-WEB: direkter Downloadlink zum OAIS DIP verfügbar.
  • verschiedene Links zu institutionellen und öffentlichen Deriveraten im Presenation Repository (PIP)
  • Generische Schnittstelle zur Abfrage durch Drittsysteme und Rückmeldung über Archivierungsstatus (s.u.)
  • Ausgabe von Codec-Bezeichnungen.
  • Packageebene sichtbar

LZA-Geschäftslogik

  • Erkennung von Codecs hier geht die Software über die klassische Fido Erkennung hinaus.
  • Health-Check der Codec-Identifier.
  • Bei der Delta-Einlieferung kann anstelle des gleichen OrigNames auch der technische Name des Objekts als Paketname angegeben werden
  • PREMIS: Unterstützung des agentName-Elements und des originalName-Elements
  • Eigene PDF Konversion validiert jetzt PDF/A 1b : Apache pdfbox
  • Konvertierung aller gängigen Word Formate: (DOC/DOCX) Konvertierung nach PDF-A, mittels ASP.NET Webservice und Ghostscript, anschl. Validierung von PDF/A 1b Konvertierungsergebnis mit pdfbox (Apache).
  • PAM SSL Support im CB für die initiale Authentifizierung der CB Systembenutzer.
  • Lücken in der Erfüllung des BagIt-Standards nun vollständig geschlossen
  • URNs werden aus PREMIS- und METS-Dateien ausgelesen und verwendet

Präsentation / Publikation

  • xepicur zur Meldung der URN an den DNB Resovler wird unterstützt.
  • Harvesting durch die DDB kann per Contract ausgeschlossen werden, falls das Objekt schon bereits gemeldet wurde.

Sonstige Neuerungen

  • Replikation wird vom CB initiiert.

Technische Besonderheiten

Der ContentBroker ist unter Java7 getestet und lauffähig (JRE7). Die DA-WEB Applikation läuft unter Java7 und Tomcat 7. (JRE7)

Bugfixes

  • PIPs werden von Quellresourcen getrimmt

Installation der DNS (Update auf Basis einer Installation der Version 0.6.0)

Installationsanweisungen SIP-Builder

Installations-/Änderungsanweisungen iRODS

Installations-/Änderungsanweisungen ContentBroker

Inhalte der ContentBroker0.6.1.tgz
./ContentBroker.jar
./ffmpeg.sh
./fido.sh
./conf/logback.xml
./conf/beans.xml
./conf/healthCheck.avi

Achtung, vor dem Entpacken überprüfen, ob es eventuell notwendig ist, die vorigen Dateien zu sichern (z.B. um spezielle Anpassungen zu bewahren). Der Installer ist als tarbomb konzipiert und sollte im CB Basisverzeichnis entpackt werden

  • Tarbomb im CB Basisverzeichnis entpacken

  • in der fido.sh den Inhalt der Variable PYTHON_PATH notieren, falls er nicht "python" ist, d.h. dass die richtige Python Version nicht im Pfad liegt

  • ContentBroker runterfahren

  • Installer-Datei herunterladen und als Tar-Bomb im ContentBroker-Basisverzeichnis entpacken

  • FFMPEG installieren, falls das noch nicht geschehen ist.

  • Ein Mapping in der conf/hibernateCentralDB.cfg hinzufügen für


  • Anpassungen in der config.properties vornehmen
localNode.replDestinations=cp_tsm,hbz,lvr 
(hier die ResourceGroup des eigenen Knoten zuerst nennen)
grid.implementation=irodsGridFacade
uris.file=http://data.danrw.de/file
irods.pam=false
irods.keyStorePassword=
irods.keyStorePath=
irods.trustStorePath=
(ja, ist richtig, die Teile haben noch keine Werte)
  • ContentBroker starten

Installation DA-WEB

  • Stop des Tomcat
  • Sichern der alten daweb3.war
  • Falls +gewünscht+, kann Tomcat auf Version 7 geändert werden. Die daweb3 ist unter Tomcat6 ebenso lauffähig.
  • Alte Webapp undeploy/löschen, vorher daweb_properties.groovy aus Ordner WEB-INF/classes/ sichern.
  • Neues Warfile herunterladen https://da-nrw.hki.uni-koeln.de/appliance/daweb3.war
  • Deploy War.
  • Start Tomcat
  • cp der gesicherten daweb3_properties.groovy wieder in das Verzeichnis WEB-INF/classes/ der ausgepackten Webapp
  • Anpassen der daweb3_properties.groovy: Parameter
    fedora.urlPrefix = "https://www.danrw.de/fedora/objects/"
* Hinzufügen eines Parameters:
cb.presServer= "da-nrw.hki.uni-koeln.de" 
* Alle Parameter die identische Bezeichnungen auch in der CB.conf haben, haben natürlich auch die gleichen Werte. * start Tomcat

Statusabfrage via generischer Schnittstelle, zur Abfrage des DA-NRW durch Drittsysteme:*

Liefert (Beisp. ein archiviertes Objekt, mit laufendem Retrieval ):

{"urn":"urn:nbn:de:danrw-131614-2013111519609","contractor":"TEST","origName":"testPackage_docx99","identifier":"131614-2013111519609","status":"archived - but in progress","packages":["1“]}
  • Archivierte Objekte kennen die Status: ** archived ** not found ** archived - but in progress (Delta wird angeliefert, Audit oder Retrieval)
  • Noch nicht fertig archivierte Packages kennen die Status: ** in progress ** error ** not found