Fonctionnalités de mise à jour
Clemlab a introduit la fonctionnalité de mise à jour avec **OpenSource Data Platform (ODP) 1.2.2.0 ** version. La documentation de mise à jour est divisé en 3 parties:
- Description de la fonctionnalités de mise à jour (cette page)
- Mise à jour d'Ambari
- Mise à jour d'ODP
Chaque article décrit les prérequis, la procédure de mise à jour, et les détails d'attention.
Support des mises à jours
Vous devez utiliser Apache Ambari 2.7.11.0 avec ODP en version minimum 1.2.1.X afin de pouvoir mettre à jour vers la version 1.2.4.0 de la distribution Open Source Hadoop ODP.
Apache Ambari ** 2.7.11.0 ** est la dernière version compatible avec ODP 1.2.4.0. Vous devez être sur que vous utilisez la bonne version d'ambari avant de lancer la procédure d'upgrade.
Prérequis spécifiques à Ubuntu
Starting from OpenSource Data Platform (ODP) 1.2.2.0, Python 2 is no longer supported. Ensure that all your scripts and dependencies are compatible with Python 3.
If you are using Ubuntu, you need to install the python-is-python3
package. This package is required for the upgrade process. It will ensure that the python
command points to python3
instead of python2
.
sudo apt-get install python-is-python3
Préparation de la mise à pour Ambari et ODP
Avant de mettre à jour Ambari et la distribution ODP, votre cluster doit être démarré et en bonne santé. Nous vous recommandons les points de vérifications suivants:
- Vérifier que tous les services sont démarrés
Confirmez que vous pouvez arrêter et démarrer tous les services avec succès.
Vous devez exécuter Ambari Service Check sur tous les services.
Effacez toutes les alertes, pour cela vous devez comprendre pourquoi elles sont générées. Corrigez si nécessaire. Si vous êtes un client Clemlab, vous pouvez demander de l’aide au support.
Le démarrage et l'arrêt des services influencent considérablement la durée totale de la mise à niveau. Avant de procéder à la mise à jour, téléchargez les paquets à partir des dépôts au préalable pour gagner du temps. Stockez-les dans un dépôt local ou pensez à utiliser un proxy de stockage, car tous les nœuds du cluster devront télécharger plusieurs gigaoctets. Assurez-vous de créer des sauvegardes pour toutes les bases de données dont les services ont besoin. Cela inclut, Ambari, Hive, Ranger, Ranger KMS et Oozie.
Pour un gros cluster, le temps de démarrage du service NameNode peut être très long. Vous pouvez configurer Ambari pour qu’il n'interrompe pas trop tôt le redémarrage du NameNode. Pour cela, vous pouvez configurer /etc/ambari-server/conf/ambari.properties
.
Par exemple, si vous voulez définir 15 minutes pour le délai d’expiration, vous pouvez définir :
upgrade.parameter.nn-restart.timeout=900
Une fois configuré, vous devez redémarrer le service Ambari.
systemctl restart ambari-server ou ambari-server restart