Stand der Dinge: Update V3 zu V4 in der Zeit vom 22.11. 21:00 Uhr bis 23.11 ca. 23:30 Uhr 361

23.11.2012
Liebe MKler,

seit einiger Zeit bereiten wir nun schon das Update auf V4 vor. Aus technischer Sicht ist die V4 ein grosser Schritt, da Hendrik diesmal sehr viel Wert auf technische Abstimmung der gesamten MK gelegt hat. Wer damals bei V2 zu V3 schon dabei war, kann sich bestimmt noch daran erinnern, wie viele Startprobleme es gab.
Diesmal gab es erst einen Preview auf V4, zum Schluss sogar eine offene Beta Phase fuer mehr als einen Monat. Wir wollten schliesslich nicht nur "sehen", wie die MK ankommt, sondern auch ein Gefuehl fuer die technische Anforderung darunter bekommen. In der letzten Zeit konnten wir einige Erkenntnisse daraus ziehen und die MK V4 weiter optimieren.
Als wir dann an einem Punkt waren, wo es technisch optimal lief, entschieden wir uns, die V4 in Betrieb zu nehmen. Die Betaseite lief auf einem kleinen Teil der MK-Infrastruktur mit und machte einen guten Eindruck. Die Umstellung bedeutet, das V4 alle Ressourcen bekommt, die V3 auch schon hatte. In Summe war also klar, dass wir die Leistungsfaehigkeit der V4 enorm steigern.

Fuer die vielen Testlaeufe, die wir davor gebraucht haben, haben wir uns nach und nach auch immer Testlaeufe gegoennt um Erfahrungswerte fuer die Migrationszeiten zu bekommen. Schliesslich ist V4 nicht nur optisch neu, sondern auch viel darunter wurde optimiert.

So kamen wir in Summe auf folgende Ergebnisse:
Wenn die Migration in dem Zeitfenster ablaeuft, das wir im optimalsten Fall bei den Tests (auf weniger Hardware!) hatten, dauert die Umstellung ca. 6 Stunden.
Laeuft das Eine oder Andere schief oder muss noch nachkorrigiert werden (die MK Daten veraendern sich ja dank euch dauernd :D), wuerde das Ganze bis zu 12 Stunden dauern.
Im schlimmsten Fall, wenn wir dann feststellen das irgendwas schief ging, nochmal dieselbe Zeit, also 24 Stunden.

Heute, knapp 24 Stunden nach dem Beginn, sind wir schlauer:
Alle Tests sind eben nur Tests, wenn die Realitaet keine Lust hat. Ein Import, der in allen Testlaeufen nie mehr als 30 Minuten gedauert hat, war nach ueber 2 Stunden nichtmal bei 20%. Ein anderer Vorgang brach staendig ab, weil bisher "nie gesehene" Daten im Datensatz drin waren. Ein kleiner Tippfehler hat uns auch Anfangs etwas mehr Zeit gekostet (man uebersieht Kleinigkeiten halt ab und an).

In Summe kann ich, fuer mich und alle Beteiligten, sagen: wir hatten viel vorbereitet, viel vorgenommen und sind trotz aller Bemuehungen wieder hier gelandet.

Warum der Import der Daten auf einmal so endlos lange gedauert hat, ist bisher ungeklaert. Wir werden das Problem analysieren, finden, beheben. Jedoch nicht mehr heute Nacht.

Des Weiteren sind einige Punkte heute umgesetzt worden, die vorbereitend fuer V4 noetig waren und somit beim naechsten Mal schon erledigt sind.

Ich lasse diesen Thread bewusst offen, da ich gerne bereit bin, mit euch darueber zu diskutieren. Jedoch seht bitte nach, dass die Diskussion vermutlich erst morgen stattfindet, da wir alle jetzt gerne erstmal eine Pause machen wuerden.

Wir schauen vorwaerts und werden mit Sicherheit in Kuerze die V4 fuer alle erleben, bis dahin trotz allem viel Spass in der V3.

Gruesse,
Darkman

Update 24.11.12 - 16:20:
Ahoi,

ich hab mich entschlossen, eure Fragen im ersten Posting zu beantworten, das erleichtert es "Einsteigern" alle Infos auf einen Blick zu haben und allen anderen das schreiben von "ich hab jetzt nicht alles gelesen, aber..."

Ich filter mal die Fragen usw. aus den Postings raus und beantworte sie hier.

Zeitangaben in der Upgrade Phase
Zuerst die "Basis" Angaben von vor dem Beginn: Wir hatten gesagt:
Idealfall: ca. 6 Stunden
Mit Probleme: ca. 12 Stunden
Wenn alle Stricke reissen: ca. 24 Stunden

Eine Aussage wie "mehr als 100% ueber dem Zeitlimit" ist also in so fern falsch, das wir am Ende 3h laenger als die 24h gebraucht haben, und nicht 48. Klar, wenn man selbst von den 6h ausgeht, dann waren es sogar deutlich mehr als die 100% - nur ist halt der Bezug dann der Falsche.

Wir haben in den ganzen Wochen VOR v4 oefter mal Tests mit den Datenbestaenden gemacht, sprich Daten exportiert und wieder importiert. Dazu haben wir Zeiten notiert, die die jeweiligen Vorgaenge benoetigt haben. Ala "Ex+Import der User - ca. 5 Minuten". Das haben wir fuer *alle* Updateteile gemacht. Am Ende wars dann relativ einfache Mathematik alles zusammen zu zaehlen und das Ergebniss als Basis zu nehmen. Wenn wir jetzt Aussagen zu weiteren Zeitpunkten gemacht haben, sind wir in unserem Ablaufplan an den Punkt gegangen wo wir gerade sind, haben ausgerechnet wieviel Zeit wir ca. noch fuer das aktuelle Problem aufwenden und den Rest der ToDo dazu genommen. Daraus ergibt sich eine Zahl, die + Puffer nehmen wir um Angaben ueber den Zeitpunkt zu machen.

Gegen Abend haben wir uns dann entschieden, v3 wieder Online zu nehmen. Dafuer hatten wir keine echte Zeitplanung, da wir nie wirklich davon ausgegangen waren, den Schritt komplett einschlagen zu muessen. Das war vermutlich unser Fehler.

Gleichzeitiger Betrieb v3 und v4
Dieser Vorschlag kam auch das ein oder andere Mal. Fuer uns, mit den Mitteln die wir haben, ist das aus verschiedenen Punkten keine Option gewesen.
Punkt 1:
Die vorhandene Hardwaremenge reicht nicht aus, beide Versionen gleichzeitig allen Usern zur Verfuegung zu stellen
Punkt 2:
Sowohl die Oberflaeche, als auch der Unterbau hat sich in grossen Teilen geaendert. Es muessten also alle Daten gedoppelt werden, was nur in manchen Bereichen ohne groessere Abhaengigkeiten ueberhaupt geht.
Punkt 3:
Treten irgendwo Probleme auf (egal auf welcher Seite) wird es umstaendlicher diese zu beheben. Ein Beispiel haben wir die letzten Stunden ja gesehen, die Umlautproblematik ist so schon schwer genug, wenn man dann 2 verschiedene Systeme faehrt, kann man das getrost Chaos nennen.

Auch der Vorschlag (der technisch schon recht "tief" ging!) einfach an alles Zeitstempel und Checksummen zu heften (stand da wirklich das man das eh macht?!) ist gut gemeint, bei unseren Daten und Mengen jedoch nicht gegeben. Die MK ist keine Bank die alles Transaktionssicher machen muss und bis ins Detail jede Aenderung nachverfolgen muss (wollen wir ehrlich gesagt auch garnicht).

Auch Hardware Dopplung aendert an diesen Punkten wenig, sie bringt sogar noch andere mit sich: unsere gesamte "Landschaft" bietet erstmal keine Moeglichkeit mal "eben" die doppelte Hardware zu verwalten. Das hat dann naemlich auch mit Platz und Strom zu tun - Dinge, die nicht einfach da sind und unmengen davon genutzt werden koennen.

Aufteilung der Systeme fuer v3 und v4
Es wurde gefragt, wie die Aufteilung der Systeme war (was auch immer daran jetzt so wichtig sein soll), daher hier mal ein paar Eckdaten:
Fuer die MK v3 sind z.Z. mindestens 8 Systeme in Betrieb. Mindestens weil wir darunter Anfangen in die Leistungsgrenzen einzelner Systeme zu kommen. Also ein bisschen Puffer noch drauf damits geschmeidig laeuft und auch mal was kaputt gegehen kann (was nicht heisst, das irgendwas irgendwann einfach kaputt gehen kann und keiner was merkt, sondern nur das wir bei dem Ausfall so umstellen koennen, das der fehlende Teil danach nicht mehr auffaellt).
Fuer den v4 Testbetrieb haben wir teilweise Resourcen der v3 mitnutzen koennen, mussten aber auch neue Bereitstellen, da die v4 teilweise andere Anforderungen an die Systeme hat (Softwarestand usw). Also haben wir ein Teil der Systeme nach und nach upgedated fuer v4 und alles andere erstmal gelassen wie gehabt, da das ja fuer v3 nicht notwendig war.

Warum wurde die V3 Landschaft angefasst obwohl die v4 nicht lief?
Wie man oben lesen kann, ist ein bisschen Hardware notwendig um die MK (egal welche Version) bereitzustellen. Die Migration bedeutete fuer uns auch, das wir alle Systeme nach und nach aktualisieren muessen, um v4 ueberhaupt in Betrieb nehmen zu koennen. Das war quasi der 1. Schritt bei der Migration. V4 laeuft nur auf aktuellen Systemen, v3 sollte es erstmal egal sein, neue Funktionen werden ja nicht genutzt. Als wir zu v3 zurueckmussten, war quasi die Frage: machen wir alles aus den letzten Stunden rueckgaengig? oder lassen wir die Systeme aktuell und passen v3 an falls noetig? Vorteil liegt auf der Hand: wenn ich die Systeme aktuell halte, kann ich 1. v4 auf den selben Systemen paralell betreiben und beim naechsten Upgrade spare ich mir diesen Schritt schonmal.
Daher war die Entscheidung recht schnell gefallen. Findet diese Entscheidung jemand total hirnrissig?

Uebrigens der Vorschlag mit der Cloud: Hendrik (und da bin ich ganz bei ihm) moechte keine Nutzerdaten von euch in irgend einer Cloud haben.

Externe Dienstleister
Ich bin quasi eine Art externer Dienstleister. Ich unterstuetze Hendrik bei der Technik und versuche mich sonst rauszuhalten - eben um nicht Betriebsblind zu sein oder zu werden.
Ich habe mit Hendrik zusammen in der Vorbereitung einige Tests gemacht und wir haben zusammen viel an den Ablaeufen optimiert. Ich muss mir also Vorwerfen lassen, das wir irgendwo etwas uebersehen haben. Was genau weiss ich inzwischen immernoch nicht, denn das Phaenomen das wir haben, ist uns bisher komplett unklar. Wir arbeiten aber dran.

Das Update war ein Desaster
War es das? Weiss ich nicht. Es ist jedenfalls am Ende nicht fertig geworden. Ein Desaster waer es, wenn wir Daten verloren haetten, haben wir nicht, find ich gut.

Umlautfuckup
Die v3 verwendet latin1 als Kodierung. Fuer V4 ist UTF8 geplant und genutzt. Alleine dafuer muss ich leider jeden Datenbankeintrag einmal rausholen + wieder reinschreiben. Ein guter Grund fuer eine Migration dieser Art. Bei in Betriebnahme von v3 auf den v4 Systemen haben wir, so dachten wir, alle UTF8 Punkte wieder abgestellt. Leider war dem nicht so (hat man ja gesehen) und es hat am Ende nochmal fast eine Stunde suchen und Testen gekostet, bis die letzte Stelle gefunden war (in dem Fall wars ein Defaultsetting vom neuen System das nicht lokal ueberschrieben werden konnte). Inzwischen ist aber auch das wieder ordentlich.

Datenbank + Menge
Lieber VigarLunaris, schoen das Du unser Datenmodel als reiner Nutzer schon "erkennst". Unsere PNs sind knapp 60 Mio, das sind ca. 35GB Daten, wenn euer Ticketsystem also schon mehr hat, koennte das ein Zeichen fuer Probleme sein? Anyway. Wir haben eine Menge Daten, die allgemeinhin schon weit entfernt von "einfach zu handhaben" sind. Die Menge als solches war bisher kein grosses Problem fuer uns. Bei der Migration letzte Nacht war die Menge zwar entscheident (haetten wir weniger, waers schneller fertig gewesen) fuer die Zeit, jedoch unerheblich fuers System. Der Import der Daten war langsam wie nie und wir hatten nach 2 Stunden nichtmal 15% der Daten importiert, wo normalerweise 100% in 30 Minuten erreicht waren.
Entgegen der "Blob" Aussage speichern wir Bilder uebrigens NICHT in der Datenbank, das ist etwas das selbst nicht-IT-Profis schon besser erkannt haben.
Dein KnowHow und so in allen Ehren, einfach Zahlen in den Thread werfen ist mehr Aufmerksamkeitshascherei als wirkliche Demonstration von Wissen, das haben andere in diesem Thread besser gemacht.

Offene Probleme aktuell (Stand: 02:20 / 25.11.12)
- Bildupload bei manchen gestoert
- Erledigt: E-Mail Benachrichtigung teilweise gestoert

(wir arbeiten dran)

Gruesse,
Darkman
23.11.2012
Been there - done that. Komme selbst aus der IT und kann das nachempfinden.

Ruht euch erst mal aus und bekommt den Kopf frei, danach könnt ihr in Ruhe
analysieren - wir können auch noch bis nächstes Jahr auf die v4 warten.
einfach nur DANKE an die gesamte technik!
hoffe, die lust/freude/gute laune ist ungebremst und wird bald in einer funkelnden V4 gipfeln!

herzlichen dank für eure wahnsinns leistung!

lg martin
23.11.2012
Kopf hoch!
So eine Umstellung ist eine Riesenaufgabe und selbst wenn sicher einige es wieder besser wissen - man kann nicht alle Eventualitäten einkalkulieren. Ich bin überzeugt ihr macht einen guten Job und ich freue mich auf den nächsten Anlauf und die V4!!
oh das wird lustig hier....

[IMG]
Nicht aufgeben und den Kopf hängen lassen. Ausruhen und dann mit neuen Elan weitermachen. Wie heißt es so schön. "Rom ist auch nicht an einen Tag erbaut worden."

Danke für Eure bisherige Mühe, macht weiter so.

LG Daniel aus Bärlin.
Danke für euren Einsatz..
Bei solchen Großen Dingen kann immer etwas schief gehen..

beim nächsten Anlauf klappts bestimmt !!

*Daumen drück*

LG elisabeth
23.11.2012
Schlaft erstmal aus... dann geht's die Tage mit neuem Schwung heran...
Manchmal verstehe ich auch den ganzen Update Hype und umrüsten und so nicht...

Aus meiner eigenen jahrelangen Erfahrung im Elektroniker Job, bei der großen deutschen Firma mit S am Anfang und am Ende, kann ich nur sagen:

NEVER TOUCH A RUNNING SYSTEM!!

Aber weiterhin viel Erfolg...

mfg Jörg
23.11.2012
Schlafen und morgen habt ihr bestimmt die
passende Lösung! -:)
23.11.2012
Wir haben´s ja alle überlebt ;-)
Kopf hoch und weiterhin viel Erfolg.

Grüße
Cosmik Debris
23.11.2012
Ich finde Ihr macht einen guten Job, ich hab auch schon viele Migrationen gemacht und weiss was da alles schieflaufen kann. Schlaft und analysiert und Good Luck für das nächstemal.
23.11.2012
Na. Jetzt ist ja alles wieder ok.

Identische Technik für 1 Monat ausleihen.
Migrieren.
Alte Technik wieder abgeben.
23.11.2012
Wirklich, eine Riesenleistung! Hut ab!

Danke für Euren Einsatz und schlaft gut! :-))

Liebe Grüsse
Nadia
23.11.2012
Auch wenn ich mich ehrlich gesagt noch nicht sonderlich über die neue Version freue, fühle ich mit Euch.
Es möchte sicherlich niemand hier mit Euch tauschen, nicht nur was die Arbeit betrifft sondern auch die Erwartungshaltung der gesamten Community.
Also: schlaft Euch aus, setzt Euch einen guten Kaffee auf und dann sieht das Ganze schon wieder besser aus.
Viel Erfolg und gute Nerven! :-)
War ne super Idee mit dem Chat während des updates ;)
v4 wird rocken - kopf hoch.
23.11.2012
Fotocowboy, prinzipiell ist das eine gute Idee.
Nur keinne ich leider niemanden der mir spontan Technik in einer Ordnung von etwa 70.000 Euro leiht. Oder vermietet.

LG Hendrik
23.11.2012
Huch - der Klickzähler läuft jetzt rückwärts *lach*
#19
[gone] User_30919
23.11.2012
Mit 50 Dosen Red Bull geht das schon ;)


Original von un-schuld ~ pretty. awesome. [Shootingpause]
Nächstes Mal wirds besser. Ich bin gespannt und freu mich drauf. Schlaft erstmal alle aus (ich koennte nicht ueber 36 Stunden lang am Stueck wach bleiben und so ne Arbeit schaffen... Respekt!!)

Dann sehen wir weiter.

Gute Nacht!

Topic has been closed