回到课程

查找编程语言

有很多编程语言,例如 Java、JavaScript、PHP、C 或 C++。

构建一个正则表达式,用来匹配字符串 Java JavaScript PHP C++ C 中包含的编程语言:

let regexp = /你的正则表达式/g;

alert("Java JavaScript PHP C++ C".match(regexp)); // Java JavaScript PHP C++ C

首先想到的解法是列出所有编程语言,在它们之间加上 | 符号。

但运行结果不符合预期:

let regexp = /Java|JavaScript|PHP|C|C\+\+/g;

let str = "Java, JavaScript, PHP, C, C++";

alert( str.match(regexp) ); // Java,Java,PHP,C,C

正则表达式引擎注意查找选择。也就是说:它先检查是否存在 Java,不存在 —— 接着匹配 JavaScript 及其后的字符串。

结果,JavaScript 永远匹配不到,因为 Java 先被匹配了。

CC++ 同理。

这个问题有两个解决方式:

  1. 更改顺序以先检查较长的匹配项:JavaScript|Java|C\+\+|C|PHP
  2. 合并相同前缀:Java(Script)?|C(\+\+)?|PHP

测试一下:

let regexp = /Java(Script)?|C(\+\+)?|PHP/g;

let str = "Java, JavaScript, PHP, C, C++";

alert( str.match(regexp) ); // Java,JavaScript,PHP,C,C++