J'essayais de compter les mots dans un texte de cette manière:
function WordCount(str) {
var totalSoFar = 0;
for (var i = 0; i < WordCount.length; i++)
if (str(i) === " ") { // if a space is found in str
totalSoFar = +1; // add 1 to total so far
}
totalsoFar += 1; // add 1 to totalsoFar to account for extra space since 1 space = 2 words
}
console.log(WordCount("Random String"));
Je pense avoir assez bien compris cela, sauf que je pense que la if
déclaration est fausse. La partie qui vérifie si str(i)
contient un espace et ajoute 1.
Éditer:
J'ai découvert (grâce à Blender) que je pouvais faire cela avec beaucoup moins de code:
function WordCount(str) {
return str.split(" ").length;
}
console.log(WordCount("hello world"));
javascript
Valerio Bozz
la source
la source
str.split(' ').length
une méthode plus simple? jsfiddle.net/j08691/zUuzdstr.split(' ')
puis compter ceux qui ne sont pas des chaînes de 0 longueur?Réponses:
Utilisez des crochets et non des parenthèses:
str[i] === " "
Ou
charAt
:str.charAt(i) === " "
Vous pouvez également le faire avec
.split()
:return str.split(' ').length;
la source
Essayez-les avant de réinventer les roues
à partir du nombre de mots dans la chaîne en utilisant JavaScript
function countWords(str) { return str.trim().split(/\s+/).length; }
depuis http://www.mediacollege.com/internet/javascript/text/count-words.html
function countWords(s){ s = s.replace(/(^\s*)|(\s*$)/gi,"");//exclude start and end white-space s = s.replace(/[ ]{2,}/gi," ");//2 or more space to 1 s = s.replace(/\n /,"\n"); // exclude newline with a start spacing return s.split(' ').filter(function(str){return str!="";}).length; //return s.split(' ').filter(String).length; - this can also be used }
from Utiliser JavaScript pour compter les mots dans une chaîne, SANS utiliser une regex - ce sera la meilleure approche
function WordCount(str) { return str.split(' ') .filter(function(n) { return n != '' }) .length; }
la source
Une autre façon de compter les mots dans une chaîne. Ce code compte les mots qui contiennent uniquement des caractères alphanumériques et des caractères "_", "'", "-", "'".
function countWords(str) { var matches = str.match(/[\w\d\’\'-]+/gi); return matches ? matches.length : 0; }
la source
’'-
pour que "Cat's meow" ne compte pas pour 3 mots. Et "entre les deux"’'
dans une regex. Utilisez/[\w\d’'-]+/gi
pour éviter les avertissements ESLint no-useless-escapeAprès avoir nettoyé la chaîne, vous pouvez faire correspondre les caractères non blancs ou les limites de mots.
Voici deux expressions régulières simples pour capturer des mots dans une chaîne:
/\S+/g
/\b[a-z\d]+\b/g
L'exemple ci-dessous montre comment récupérer le nombre de mots d'une chaîne, en utilisant ces modèles de capture.
/*Redirect console output to HTML.*/document.body.innerHTML='';console.log=function(s){document.body.innerHTML+=s+'\n';}; /*String format.*/String.format||(String.format=function(f){return function(a){return f.replace(/{(\d+)}/g,function(m,n){return"undefined"!=typeof a[n]?a[n]:m})}([].slice.call(arguments,1))}); // ^ IGNORE CODE ABOVE ^ // ================= // Clean and match sub-strings in a string. function extractSubstr(str, regexp) { return str.replace(/[^\w\s]|_/g, '') .replace(/\s+/g, ' ') .toLowerCase().match(regexp) || []; } // Find words by searching for sequences of non-whitespace characters. function getWordsByNonWhiteSpace(str) { return extractSubstr(str, /\S+/g); } // Find words by searching for valid characters between word-boundaries. function getWordsByWordBoundaries(str) { return extractSubstr(str, /\b[a-z\d]+\b/g); } // Example of usage. var edisonQuote = "I have not failed. I've just found 10,000 ways that won't work."; var words1 = getWordsByNonWhiteSpace(edisonQuote); var words2 = getWordsByWordBoundaries(edisonQuote); console.log(String.format('"{0}" - Thomas Edison\n\nWord count via:\n', edisonQuote)); console.log(String.format(' - non-white-space: ({0}) [{1}]', words1.length, words1.join(', '))); console.log(String.format(' - word-boundaries: ({0}) [{1}]', words2.length, words2.join(', ')));
body { font-family: monospace; white-space: pre; font-size: 11px; }
Trouver des mots uniques
Vous pouvez également créer un mappage de mots pour obtenir des nombres uniques.
function cleanString(str) { return str.replace(/[^\w\s]|_/g, '') .replace(/\s+/g, ' ') .toLowerCase(); } function extractSubstr(str, regexp) { return cleanString(str).match(regexp) || []; } function getWordsByNonWhiteSpace(str) { return extractSubstr(str, /\S+/g); } function getWordsByWordBoundaries(str) { return extractSubstr(str, /\b[a-z\d]+\b/g); } function wordMap(str) { return getWordsByWordBoundaries(str).reduce(function(map, word) { map[word] = (map[word] || 0) + 1; return map; }, {}); } function mapToTuples(map) { return Object.keys(map).map(function(key) { return [ key, map[key] ]; }); } function mapToSortedTuples(map, sortFn, sortOrder) { return mapToTuples(map).sort(function(a, b) { return sortFn.call(undefined, a, b, sortOrder); }); } function countWords(str) { return getWordsByWordBoundaries(str).length; } function wordFrequency(str) { return mapToSortedTuples(wordMap(str), function(a, b, order) { if (b[1] > a[1]) { return order[1] * -1; } else if (a[1] > b[1]) { return order[1] * 1; } else { return order[0] * (a[0] < b[0] ? -1 : (a[0] > b[0] ? 1 : 0)); } }, [1, -1]); } function printTuples(tuples) { return tuples.map(function(tuple) { return padStr(tuple[0], ' ', 12, 1) + ' -> ' + tuple[1]; }).join('\n'); } function padStr(str, ch, width, dir) { return (width <= str.length ? str : padStr(dir < 0 ? ch + str : str + ch, ch, width, dir)).substr(0, width); } function toTable(data, headers) { return $('<table>').append($('<thead>').append($('<tr>').append(headers.map(function(header) { return $('<th>').html(header); })))).append($('<tbody>').append(data.map(function(row) { return $('<tr>').append(row.map(function(cell) { return $('<td>').html(cell); })); }))); } function addRowsBefore(table, data) { table.find('tbody').prepend(data.map(function(row) { return $('<tr>').append(row.map(function(cell) { return $('<td>').html(cell); })); })); return table; } $(function() { $('#countWordsBtn').on('click', function(e) { var str = $('#wordsTxtAra').val(); var wordFreq = wordFrequency(str); var wordCount = countWords(str); var uniqueWords = wordFreq.length; var summaryData = [ [ 'TOTAL', wordCount ], [ 'UNIQUE', uniqueWords ] ]; var table = toTable(wordFreq, ['Word', 'Frequency']); addRowsBefore(table, summaryData); $('#wordFreq').html(table); }); });
table { border-collapse: collapse; table-layout: fixed; width: 200px; font-family: monospace; } thead { border-bottom: #000 3px double;; } table, td, th { border: #000 1px solid; } td, th { padding: 2px; width: 100px; overflow: hidden; } textarea, input[type="button"], table { margin: 4px; padding: 2px; }
<script src="https://ajax.googleapis.com/ajax/libs/jquery/1.11.1/jquery.min.js"></script> <h1>Word Frequency</h1> <textarea id="wordsTxtAra" cols="60" rows="8">Four score and seven years ago our fathers brought forth on this continent, a new nation, conceived in Liberty, and dedicated to the proposition that all men are created equal. Now we are engaged in a great civil war, testing whether that nation, or any nation so conceived and so dedicated, can long endure. We are met on a great battle-field of that war. We have come to dedicate a portion of that field, as a final resting place for those who here gave their lives that that nation might live. It is altogether fitting and proper that we should do this. But, in a larger sense, we can not dedicate -- we can not consecrate -- we can not hallow -- this ground. The brave men, living and dead, who struggled here, have consecrated it, far above our poor power to add or detract. The world will little note, nor long remember what we say here, but it can never forget what they did here. It is for us the living, rather, to be dedicated here to the unfinished work which they who fought here have thus far so nobly advanced. It is rather for us to be here dedicated to the great task remaining before us -- that from these honored dead we take increased devotion to that cause for which they gave the last full measure of devotion -- that we here highly resolve that these dead shall not have died in vain -- that this nation, under God, shall have a new birth of freedom -- and that government of the people, by the people, for the people, shall not perish from the earth.</textarea><br /> <input type="button" id="countWordsBtn" value="Count Words" /> <div id="wordFreq"></div>
la source
Je pense que cette méthode est plus que ce que vous voulez
var getWordCount = function(v){ var matches = v.match(/\S+/g) ; return matches?matches.length:0; }
la source
String.prototype.match
retourne un tableau, on peut alors vérifier la longueur,Je trouve que cette méthode est la plus descriptive
var str = 'one two three four five'; str.match(/\w+/g).length;
la source
Le moyen le plus simple que j'ai trouvé jusqu'à présent est d'utiliser une regex avec split.
var calculate = function() { var string = document.getElementById('input').value; var length = string.split(/[^\s]+/).length - 1; document.getElementById('count').innerHTML = length; };
<textarea id="input">My super text that does 7 words.</textarea> <button onclick="calculate()">Calculate</button> <span id="count">7</span> words
la source
La réponse donnée par @ 7-isnotbad est extrêmement proche, mais ne compte pas les lignes d'un seul mot. Voici le correctif, qui semble tenir compte de toutes les combinaisons possibles de mots, d'espaces et de nouvelles lignes.
function countWords(s){ s = s.replace(/\n/g,' '); // newlines to space s = s.replace(/(^\s*)|(\s*$)/gi,''); // remove spaces from start + end s = s.replace(/[ ]{2,}/gi,' '); // 2 or more spaces to 1 return s.split(' ').length; }
la source
Voici mon approche, qui divise simplement une chaîne par des espaces, puis for boucle le tableau et augmente le nombre si le tableau [i] correspond à un modèle d'expression régulière donné.
function wordCount(str) { var stringArray = str.split(' '); var count = 0; for (var i = 0; i < stringArray.length; i++) { var word = stringArray[i]; if (/[A-Za-z]/.test(word)) { count++ } } return count }
Invoqué comme ça:
var str = "testing strings here's a string --.. ? // ... random characters ,,, end of string"; wordCount(str)
(ajout de caractères et d'espaces supplémentaires pour montrer la précision de la fonction)
La chaîne ci-dessus renvoie 10, ce qui est correct!
la source
[A-Za-z]
du toutCela traitera tous les cas et sera aussi efficace que possible. (Vous ne voulez pas de split ('') sauf si vous savez à l'avance qu'il n'y a pas d'espaces de longueur supérieure à un.):
var quote = `Of all the talents bestowed upon men, none is so precious as the gift of oratory. He who enjoys it wields a power more durable than that of a great king. He is an independent force in the world. Abandoned by his party, betrayed by his friends, stripped of his offices, whoever can command this power is still formidable.`; function WordCount(text) { text = text.trim(); return text.length > 0 ? text.split(/\s+/).length : 0; } console.log(WordCount(quote));//59 console.log(WordCount('f'));//1 console.log(WordCount(' f '));//1 console.log(WordCount(' '));//0
la source
Il existe peut-être un moyen plus efficace de le faire, mais c'est ce qui a fonctionné pour moi.
function countWords(passedString){ passedString = passedString.replace(/(^\s*)|(\s*$)/gi, ''); passedString = passedString.replace(/\s\s+/g, ' '); passedString = passedString.replace(/,/g, ' '); passedString = passedString.replace(/;/g, ' '); passedString = passedString.replace(/\//g, ' '); passedString = passedString.replace(/\\/g, ' '); passedString = passedString.replace(/{/g, ' '); passedString = passedString.replace(/}/g, ' '); passedString = passedString.replace(/\n/g, ' '); passedString = passedString.replace(/\./g, ' '); passedString = passedString.replace(/[\{\}]/g, ' '); passedString = passedString.replace(/[\(\)]/g, ' '); passedString = passedString.replace(/[[\]]/g, ' '); passedString = passedString.replace(/[ ]{2,}/gi, ' '); var countWordsBySpaces = passedString.split(' ').length; return countWordsBySpaces;
}
il est capable de reconnaître tous les éléments suivants comme des mots séparés:
abc,abc
= 2 mots,abc/abc/abc
= 3 mots (fonctionne avec des barres obliques avant et arrière),abc.abc
= 2 mots,abc[abc]abc
= 3 mots,abc;abc
= 2 mots,(certaines autres suggestions que j'ai essayées comptent chaque exemple ci-dessus comme un seul mot).
ignore tous les espaces blancs de début et de fin
compte une seule lettre suivie d'une nouvelle ligne, comme un mot - que j'ai trouvé que certaines des suggestions données sur cette page ne comptent pas, par exemple:
a
a
a
a
a est
parfois compté comme 0 x mot, et les autres fonctions ne le comptent que comme 1 x mot, au lieu de 5 x mots)
si quelqu'un a des idées sur la façon de l'améliorer, ou plus propre / plus efficace - alors ajoutez-vous 2 cents! J'espère que cela aide quelqu'un.
la source
function countWords(str) { var regEx = /([^\u0000-\u007F]|\w)+/g; return str.match(regEx).length; }
Explication:
/([^\u0000-\u007F]|\w)
correspond aux caractères de mots - ce qui est génial -> regex fait le gros du travail pour nous. (Ce modèle est basé sur la réponse SO suivante: https://stackoverflow.com/a/35743562/1806956 par @Landeeyo)+
correspond à la chaîne entière des caractères de mot spécifiés précédemment - nous regroupons donc essentiellement les caractères de mot./g
signifie qu'il continue de chercher jusqu'à la fin.str.match(regEx)
renvoie un tableau des mots trouvés - nous comptons donc sa longueur.la source
Pour ceux qui souhaitent utiliser Lodash peuvent utiliser la
_.words
fonction:var str = "Random String"; var wordCount = _.size(_.words(str)); console.log(wordCount);
<script src="https://cdnjs.cloudflare.com/ajax/libs/lodash.js/4.17.11/lodash.min.js"></script>
la source
La précision est également importante.
L'option 3 remplace essentiellement tous les espaces, sauf tous, par un
+1
, puis évalue cela pour compter les1
's en vous donnant le nombre de mots.C'est la méthode la plus précise et la plus rapide des quatre que j'ai faites ici.
Veuillez noter qu'il est plus lent que,
return str.split(" ").length;
mais il est précis par rapport à Microsoft Word.Voir le fichier ops / s et le nombre de mots retournés ci-dessous.
Voici un lien pour exécuter ce test au banc. https://jsbench.me/ztk2t3q3w5/1
// This is the fastest at 111,037 ops/s ±2.86% fastest var str = "All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy."; function WordCount(str) { return str.split(" ").length; } console.log(WordCount(str)); // Returns 241 words. Not the same as Microsoft Word count, of by one. // This is the 2nd fastest at 46,835 ops/s ±1.76% 57.82% slower var str = "All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy."; function WordCount(str) { return str.split(/(?!\W)\S+/).length; } console.log(WordCount(str)); // Returns 241 words. Not the same as Microsoft Word count, of by one. // This is the 3rd fastest at 37,121 ops/s ±1.18% 66.57% slower var str = "All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy."; function countWords(str) { var str = str.replace(/\S+/g,"\+1"); return eval(str); } console.log(countWords(str)); // Returns 240 words. Same as Microsoft Word count. // This is the slowest at 89 ops/s 17,270 ops/s ±2.29% 84.45% slower var str = "All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy."; function countWords(str) { var str = str.replace(/(?!\W)\S+/g,"1").replace(/\s*/g,""); return str.lastIndexOf(""); } console.log(countWords(str)); // Returns 240 words. Same as Microsoft Word count.
la source
Voici une fonction qui compte le nombre de mots dans un code HTML:
$(this).val() .replace(/(( )|(<[^>]*>))+/g, '') // remove html spaces and tags .replace(/\s+/g, ' ') // merge multiple spaces into one .trim() // trim ending and beginning spaces (yes, this is needed) .match(/\s/g) // find all spaces by regex .length // get amount of matches
la source
let leng = yourString.split(' ').filter(a => a.trim().length > 0).length
la source
Je ne sais pas si cela a été dit précédemment, ou si c'est ce qui est nécessaire ici, mais ne pourriez-vous pas faire de la chaîne un tableau et trouver la longueur?
let randomString = "Random String"; let stringWords = randomString.split(' '); console.log(stringWords.length);
la source
Je pense que cette réponse donnera toutes les solutions pour:
function NumberOf() { var string = "Write a piece of code in any language of your choice that computes the total number of characters, words and lines in a given text. \n This is second line. \n This is third line."; var length = string.length; //No of characters var words = string.match(/\w+/g).length; //No of words var lines = string.split(/\r\n|\r|\n/).length; // No of lines console.log('Number of characters:',length); console.log('Number of words:',words); console.log('Number of lines:',lines); } NumberOf();
string.length
string.match(/\w+/g).length
string.length(/\r\n|\r|\n/).length
J'espère que cela peut aider ceux qui recherchent ces 3 réponses.
la source
string
de la variable en autre chose. C'est confu. Cela m'a fait penser une secondestring.match()
est une méthode statique. À votre santé.<textarea name="myMessage" onkeyup="wordcount(this.value)"></textarea> <script type="text/javascript"> var cnt; function wordcount(count) { var words = count.split(/\s/); cnt = words.length; var ele = document.getElementById('w_count'); ele.value = cnt; } document.write("<input type=text id=w_count size=4 readonly>"); </script>
la source
Je sais que c'est tard mais cette regex devrait résoudre votre problème. Cela correspondra et retournera le nombre de mots dans votre chaîne. Plutôt celui que vous avez marqué comme solution, qui compterait le mot espace-espace comme 2 mots même s'il ne s'agit en réalité que d'un seul mot.
function countWords(str) { var matches = str.match(/\S+/g); return matches ? matches.length : 0; }
la source
Vous avez des erreurs dans votre code.
function WordCount(str) { var totalSoFar = 0; for (var i = 0; i < str.length; i++) { if (str[i] === " ") { totalSoFar += 1; } } return totalSoFar + 1; // you need to return something. } console.log(WordCount("Random String"));
Il existe un autre moyen simple d'utiliser des expressions régulières:
(text.split(/\b/).length - 1) / 2
La valeur exacte peut différer d'environ 1 mot, mais elle compte également les bordures de mots sans espace, par exemple "mot-mot.word". Et il ne compte pas les mots qui ne contiennent ni lettres ni chiffres.
la source
function totalWordCount() { var str ="My life is happy" var totalSoFar = 0; for (var i = 0; i < str.length; i++) if (str[i] === " ") { totalSoFar = totalSoFar+1; } totalSoFar = totalSoFar+ 1; return totalSoFar } console.log(totalWordCount());
la source
function WordCount(str) { var totalSoFar = 0; for (var i = 1; i < str.length; i++) { if (str[i] === " ") { totalSoFar ++; } } return totalSoFar; } console.log(WordCount("hi my name is raj));
la source