L’équipe Jetpack a annoncé aujourd’hui que son le service de recherche est désormais disponible dans un package séparé du pack professionnel, il était auparavant sous. Cette décision devrait rendre le service plus abordable pour les petits sites. Les sites plus importants peuvent devoir débourser plus d’argent, selon la quantité de contenu sur le site.

“Jetpack Search n’était disponible que dans le cadre du plan Jetpack Professional à 29 $ par mois, mais cette tarification semblait injuste: un site avec un million de publications coûte 1000 fois plus cher à indexer qu’un site avec mille publications, mais les deux sites payaient le même montant », a écrit Greg Brown, chercheur en recherche chez Automattic, dans le message d’annonce. «La nouvelle tarification rend Jetpack Search plus abordable pour les petits sites et coûte toujours moins cher aux grands sites que la concurrence.»

Jetpack Search facture désormais en fonction du nombre d’enregistrements:

  • Jusqu’à 100 enregistrements: 5 $ par mois
  • Jusqu’à 1000 enregistrements: 10 $ par mois
  • Jusqu’à 10 000 enregistrements: 25 $ par mois
  • Jusqu’à 100 000 enregistrements: 60 $ par mois
  • Jusqu’à 1 million d’enregistrements: 200 $ par mois
  • Plus d’un million d’enregistrements: 200 $ par mois par million d’enregistrements

Les «enregistrements» sont des publications, des pages et des types de publication personnalisés. Cependant, cela pourrait changer à l’avenir. “Nous avons décidé d’utiliser le terme” enregistrements “parce que nous pensons qu’il existe des cas d’utilisation où nous pouvons vouloir indexer les commentaires comme leurs propres enregistrements dans le futur”, a déclaré Brown. “De même, il existe des cas d’utilisation pour l’indexation des auteurs, des balises, des catégories, etc. en tant que leurs propres enregistrements.”

Jetpack Search combine les commentaires et les réponses du plugin bbPress, qui sont techniquement un type de publication personnalisé, avec leur publication parent. Pour l’instant, ceux-ci ne compteront pas dans le nombre d’enregistrements des utilisateurs.

Une mise en garde avec la recherche est que les pièces jointes des médias sont considérées par défaut comme des enregistrements individuels. Il existe de bonnes raisons pour certains sites d’exposer des pièces jointes via les résultats de recherche. Cependant, cela pourrait entraîner des enregistrements indésirables et coûter plus cher chaque mois pour les utilisateurs qui ont beaucoup de médias mais ne souhaitent pas compter ces pages. Jetpack a un crochet de filtre qui contrôle les types de publication mis en cache sur les serveurs WordPress.com, donc cela peut au moins être configuré via le code.

Version 8.4 du Plugin Jetpack comprend également une interface de recherche mise à jour. Lorsqu’un visiteur du site saisit une requête de recherche, un modal plein écran apparaît pour présenter les résultats de la recherche. Les résultats sont rapides car ils reposent sur l’API WordPress.com et la technologie mise à jour en dessous. La nouvelle interface devrait bien fonctionner avec la plupart des thèmes prêts à l’emploi sur les vues de bureau et mobiles.

Capture d'écran des nouveaux résultats de recherche Jetpack.
Résultats de la recherche Jetpack modal.

“Cette nouvelle version de Search n’est disponible qu’avec le nouveau plan”, a déclaré Brown. «La version précédente de Search est toujours disponible sur le plan Pro et continuera de fonctionner telle quelle dans un avenir prévisible, mais nous nous concentrons à l’avenir sur la nouvelle expérience de recherche.»

Nouvelle architecture derrière Jetpack Search

La nouvelle version de Jetpack Search fonctionne sur une couche technologique ré-architecturée. L’ancien système était un wrapper Elasticsearch autour de la fonction de recherche WordPress standard. Bien qu’il ait été plus rapide que les résultats de recherche WordPress normaux, il était toujours plus lent que nécessaire. Il n’y avait pas de correction orthographique intégrée. Les termes recherchés n’étaient pas mis en évidence.

Le nouveau système utilise la même technologie de synchronisation que les fonctionnalités Jetpack comme les publications associées, la publicité et les statistiques pour mettre en cache le contenu. Il crée ensuite un index de recherche à l’aide du moteur Elasticsearch à partir du cache.

L’équipe a construit une API optimisée, qui prend désormais en charge la recherche en tant que type d’utilisateur et utilise les statistiques de page vue dans le cadre de l’algorithme dans le classement des résultats. L’entrée de recherche va également directement du navigateur à l’API sur WordPress.com, ce qui minimise le délai de retour des résultats.

“Tous les moteurs de recherche fonctionnent en prétraitant les données pour garantir que lorsque la requête de recherche d’un utilisateur arrive, les résultats peuvent être rapidement renvoyés”, a déclaré Brown. «Pour Jetpack Search, très peu de temps de traitement sur nos serveurs est consacré au traitement des requêtes. Presque toute la charge du serveur provient de l’indexation des données et de leur réindexation à mesure que le contenu change. Dans notre cluster de recherche principal, par exemple, seulement 10% du temps processeur est consacré au traitement d’environ 850 requêtes de recherche par seconde. La plupart du temps est consacré aux 650 opérations d’index par seconde. »

Brown explique que cette nouvelle architecture est la raison pour laquelle les nouveaux niveaux de tarification sont basés sur le nombre d’enregistrements mis en cache à partir d’un site. «Nous prétraitons les données, ce qui augmente leur taille; stockez-le sur les SSD les plus rapides que nous puissions acheter; répliquez-le dans plusieurs centres de données; et peut ensuite servir rapidement les résultats dès qu’une demande de recherche parvient à notre API. “

Pour les lecteurs qui sont intéressés par une panne plus technique du système, Brown a écrit un aperçu complet intitulé Indexation Elasticsearch en temps réel sur WordPress.com sur le blog Data for Breakfast.


Source link

%d blogueurs aiment cette page :