Questions marquées «similarity»

18
Regroupement basé sur des scores de similitude

Supposons que nous avons un ensemble d'éléments E et une similitude ( non loin ) fonction SIM (ei, ej) entre deux éléments ei, ej ∈ E . Comment pourrions-nous (efficacement) regrouper les éléments de E , en utilisant sim ? k -moyen, par exemple, nécessite un k donné , Canopy Clustering nécessite...

16
agrandir la carte thermique de Seaborn

Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen d'imprimer...

15
Prédiction de similarité de phrase

Je cherche à résoudre le problème suivant: j'ai un ensemble de phrases comme ensemble de données et je veux pouvoir taper une nouvelle phrase et trouver la phrase à laquelle la nouvelle est la plus similaire dans l'ensemble de données. Un exemple ressemblerait à: Nouvelle phrase: " I opened a new...

12
MinHashing vs SimHashing

Supposons que j'ai cinq ensembles que j'aimerais regrouper. Je comprends que la technique SimHashing décrite ici: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ pourrait produire trois grappes ( {A}, {B,C,D}et {E}), par exemple, si ses résultats étaient: A -> h01 B...

10
Quand choisir la régression linéaire ou l'arbre de décision ou la régression de forêt aléatoire? [fermé]

Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question pour qu'elle se concentre sur un seul problème en modifiant ce post . Fermé il y a 4 ans . Je travaille sur un projet et j'ai du mal à décider...

10
Comment faire un produit intérieur par lots dans Tensorflow?

J'ai deux tenseur a:[batch_size, dim] b:[batch_size, dim]. Je veux faire un produit intérieur pour chaque paire du lot, en générant c:[batch_size, 1], où c[i,0]=a[i,:].T*b[i,:].

8
Score de similitude des chaînes de matrice

J'ai une charge de documents, qui ont une charge de paires de valeurs clés en eux. La clé peut ne pas être unique, il peut donc y avoir plusieurs clés du même type avec des valeurs différentes. Je veux comparer la similitude des clés entre 2 documents. Plus précisément la similitude des chaînes de...

8
Correction des incohérences des données

J'essaie d'analyser certaines données que j'ai, mais il y a beaucoup d'incohérences dans mes données. J'ai une table SQL que j'essaie d'analyser. Le tableau est un tableau des universités avec la structure suivante: Le name:string, city:string, state:string, country:string nom est toujours présent...