-
Notifications
You must be signed in to change notification settings - Fork 14
Release notes v0.6.1
Liebe Administratoren, liebe Betreiber, liebe Interessierte,
wir stellen die Version 0.6.1 Sprockhövel der DA-NRW Software Suite vor!
Um die neuen Features hinsichtlich der URN-Behandlung zu ermöglichen und das Gesamtsystem intern schlüssiger und wartbarer zu halten, wurde in der neuen Version das interne Datenmodell ausdrucksstärker gestaltet. Es ist nun vollständig objektbasiert anstatt wie bisher packagebasiert ausgerichtet und gleichzeitig wurde eine scharfe Trennung von Objektidentifier und URN herbeigeführt.
Dies hat für den Betrieb der Software folgende Konsequenzen:
- Die Ansicht der Jobs in der DA-WEB zeigt anstelle der Package-id den Objekt-Identifier.
- Die Logs sind nun unter ContentBroker/log/object-logs/.log zu finden.
- Die in Verarbeitung befindlichen Objekte finden sich auf der WorkArea unter fork//
- Die DIPs werden als .tar ausgeliefert.
Die Version beinhaltet weiterhin folgende Änderungen:
- Lücken in der Erfüllung des BagIt-Standards nun vollständig geschlossen
- DDBexclusion-Option hinzugefügt
- CLI-Version liefert Fehlercodes zurück
- Verbessertes Management temporärer Daten
- DA-WEB: direkter Downloadlink zum OAIS DIP verfügbar.
- verschiedene Links zu institutionellen und öffentlichen Deriveraten im Presenation Repository (PIP)
- Generische Schnittstelle zur Abfrage durch Drittsysteme und Rückmeldung über Archivierungsstatus (s.u.)
- Ausgabe von Codec-Bezeichnungen.
- Packageebene sichtbar
- Erkennung von Codecs hier geht die Software über die klassische Fido Erkennung hinaus.
- Health-Check der Codec-Identifier.
- Bei der Delta-Einlieferung kann anstelle des gleichen OrigNames auch der technische Name des Objekts als Paketname angegeben werden
- PREMIS: Unterstützung des agentName-Elements und des originalName-Elements
- Eigene PDF Konversion validiert jetzt PDF/A 1b : Apache pdfbox
- Konvertierung aller gängigen Word Formate: (DOC/DOCX) Konvertierung nach PDF-A, mittels ASP.NET Webservice und Ghostscript, anschl. Validierung von PDF/A 1b Konvertierungsergebnis mit pdfbox (Apache).
- PAM SSL Support im CB für die initiale Authentifizierung der CB Systembenutzer.
- Lücken in der Erfüllung des BagIt-Standards nun vollständig geschlossen
- URNs werden aus PREMIS- und METS-Dateien ausgelesen und verwendet
- xepicur zur Meldung der URN an den DNB Resovler wird unterstützt.
- Harvesting durch die DDB kann per Contract ausgeschlossen werden, falls das Objekt schon bereits gemeldet wurde.
- Replikation wird vom CB initiiert.
Der ContentBroker ist unter Java7 getestet und lauffähig (JRE7). Die DA-WEB Applikation läuft unter Java7 und Tomcat 7. (JRE7)
- PIPs werden von Quellresourcen getrimmt
- Neue Version des SIP-Builders "hier":http://www.danrw.de/software/SipBuilder.zip herunterladen
- zip-Datei entpacken
- iRODS runterfahren
- irods/server/config/reConfigs/danrw.re ersetzen (hier runterladen: https://da-nrw.hki.uni-koeln.de/appliance/danrw.re )
- Anpassungen vornehmen, analog zur vorherigen Version (anpassen auf lokalen Knoten)
- iRODS neustarten
- ContentBroker0.6.1.tgz herunterladen. https://da-nrw.hki.uni-koeln.de/appliance/ContentBroker0.6.1.tgz
Inhalte der ContentBroker0.6.1.tgz ./ContentBroker.jar ./ffmpeg.sh ./fido.sh ./conf/logback.xml ./conf/beans.xml ./conf/healthCheck.avi
Achtung, vor dem Entpacken überprüfen, ob es eventuell notwendig ist, die vorigen Dateien zu sichern (z.B. um spezielle Anpassungen zu bewahren). Der Installer ist als tarbomb konzipiert und sollte im CB Basisverzeichnis entpackt werden
-
Tarbomb im CB Basisverzeichnis entpacken
-
in der fido.sh den Inhalt der Variable PYTHON_PATH notieren, falls er nicht "python" ist, d.h. dass die richtige Python Version nicht im Pfad liegt
-
ContentBroker runterfahren
-
Installer-Datei herunterladen und als Tar-Bomb im ContentBroker-Basisverzeichnis entpacken
-
FFMPEG installieren, falls das noch nicht geschehen ist.
-
Ein Mapping in der conf/hibernateCentralDB.cfg hinzufügen für
- Anpassungen in der config.properties vornehmen
localNode.replDestinations=cp_tsm,hbz,lvr (hier die ResourceGroup des eigenen Knoten zuerst nennen) grid.implementation=irodsGridFacade uris.file=http://data.danrw.de/file irods.pam=false irods.keyStorePassword= irods.keyStorePath= irods.trustStorePath= (ja, ist richtig, die Teile haben noch keine Werte)
- ContentBroker starten
- Stop des Tomcat
- Sichern der alten daweb3.war
- Falls +gewünscht+, kann Tomcat auf Version 7 geändert werden. Die daweb3 ist unter Tomcat6 ebenso lauffähig.
- Alte Webapp undeploy/löschen, vorher daweb_properties.groovy aus Ordner WEB-INF/classes/ sichern.
- Neues Warfile herunterladen https://da-nrw.hki.uni-koeln.de/appliance/daweb3.war
- Deploy War.
- Start Tomcat
- cp der gesicherten daweb3_properties.groovy wieder in das Verzeichnis WEB-INF/classes/ der ausgepackten Webapp
- Anpassen der daweb3_properties.groovy: Parameter
fedora.urlPrefix = "https://www.danrw.de/fedora/objects/"
cb.presServer= "da-nrw.hki.uni-koeln.de"* Alle Parameter die identische Bezeichnungen auch in der CB.conf haben, haben natürlich auch die gleichen Werte. * start Tomcat
Statusabfrage via generischer Schnittstelle, zur Abfrage des DA-NRW durch Drittsysteme:*
- https://Servername/daweb3/status/index?urn=IhreURN
- https://Servername/daweb3/status/index?origName=IhrAblieferungsname
- https://Servername/daweb3/status/index?identifier=IhrIdentifier
Liefert (Beisp. ein archiviertes Objekt, mit laufendem Retrieval ):
{"urn":"urn:nbn:de:danrw-131614-2013111519609","contractor":"TEST","origName":"testPackage_docx99","identifier":"131614-2013111519609","status":"archived - but in progress","packages":["1“]}
- Archivierte Objekte kennen die Status: ** archived ** not found ** archived - but in progress (Delta wird angeliefert, Audit oder Retrieval)
- Noch nicht fertig archivierte Packages kennen die Status: ** in progress ** error ** not found