查找编程语言
有很多编程语言,例如 Java、JavaScript、PHP、C 或 C++。
构建一个正则表达式,用来匹配字符串 Java JavaScript PHP C++ C
中包含的编程语言:
let regexp = /你的正则表达式/g;
alert("Java JavaScript PHP C++ C".match(regexp)); // Java JavaScript PHP C++ C
首先想到的解法是列出所有编程语言,在它们之间加上 |
符号。
但运行结果不符合预期:
let regexp = /Java|JavaScript|PHP|C|C\+\+/g;
let str = "Java, JavaScript, PHP, C, C++";
alert( str.match(regexp) ); // Java,Java,PHP,C,C
正则表达式引擎注意查找选择。也就是说:它先检查是否存在 Java
,不存在 —— 接着匹配 JavaScript
及其后的字符串。
结果,JavaScript
永远匹配不到,因为 Java
先被匹配了。
C
和 C++
同理。
这个问题有两个解决方式:
- 更改顺序以先检查较长的匹配项:
JavaScript|Java|C\+\+|C|PHP
。 - 合并相同前缀:
Java(Script)?|C(\+\+)?|PHP
。
测试一下:
let regexp = /Java(Script)?|C(\+\+)?|PHP/g;
let str = "Java, JavaScript, PHP, C, C++";
alert( str.match(regexp) ); // Java,JavaScript,PHP,C,C++