447 Python不同的实现，时间差别很大的原因？-慕课网

def numberOfBoomerangs(self, points: List[List[int]]) -> int: from collections import defaultdict rlt = 0 for p1 in points: dic = defaultdict(int) for p2 in points: d = (p1[0] - p2[0])**2 + (p1[1] - p2[1])**2 dic[d] += 1 for v in dic.values(): if v > 1: rlt += v * (v - 1) return rlt

def numberOfBoomerangs(self, points: List[List[int]]) -> int: rlt = 0 for x1, y1 in points: dic = {} for x2, y2 in points: dx = x1 - x2 dy = y1 - y2 d = dx*dx + dy*dy if d in dic: rlt += dic[d] dic[d] += 1 else: dic[d] = 1 return rlt*2

1回答

liuyubobobo 2021-09-12 03:07:38

我不是 python 专家，但是几个点随便说一下：

1）

for x1, y1 in points:

这种遍历中解包要比 for p1: points 之后调用 p1[0], p1[1] 快。

2）

if d in dic:
    rlt += dic[d]
dic[d] += 1

只是代码看似更简洁了。但是 dic[d] += 1 是比 dic[d] = 1 慢的，这是因为 dic[d] += 1 本质是 dic[d] = dic[d] + 1，需要先找到 dic[d]，再 +1，再将结果赋回给 dic[d]。而 dic[d] = 1 直接将 1 给 dic[d]，是更快的。在只需要赋值的时候，只做一步 dic[d] = 1 是更快的。

3）

我测试 Leetcode 的 Python 3 编译器，性能非常不稳。你给出的 350 ms 的代码，我这里提交也有 900 ms 的时候；

4）

另外，非常重要的，这两个代码，使用 Python 3 编译器确实有你说的差距，但是我尝试使用 Leetcode 的 Python 编译器，他们之间的差距没有那么大。我不确定 Leetcode 的 Python3 编译器的设置是否有可以优化的地方。（比如之前 Leetcode 的 C++ 编译就不开 -o2 优化，导致 C++ 比 Java 还慢，后来改掉了。）不过对于这一点，我不是 Python 专家，没有研究过 Python 编译器的设置。

5）

对于为什么 x**2 + y**2 会显著慢于 x*x + y*y，我也不了解。但鉴于 3),4)，我建议你先在本地调试，使用不同的编译器设置测试一下，看是否有这个结论？

如果还有这个结论，使用 C++ 或者 Java 调试这种性能问题的一个思路是看他们生成的汇编码或者字节码是否有显著的区别，道理上 Python 也会有类似的工具或者方式，但是依然是，我不是 Python 专家，对此不很了解。

6）

最后吐槽一句，这就是我一直说的，不建议使用解析型语言做强性能相关的任务的原因，因为其性能对解析器的依赖巨大，一点点写法上的改变，而非算法上的改变，就会引来巨大的性能差异。这也是为什么人工智能这类领域 Python 主要是做模型探索，真要 deliver 的话，近乎一水儿的 C++。numpy, sklearn, tf 这类库或者框架底层也是大量的 C/C++ 代码，Python 更多地是充当包装的角色。

不是说 C++ 或者 Java 没有这样的问题，但是这样的问题小太多太多。

另外。理论上，Python 社区里对这样的问题是有解决方案的，比如我听说的，使用 pypy 就对此改善巨大。不过 Leetcode 不支持 pypy，codeforces 就支持。

但不管怎样，更深入的对这个问题的分析，需要在 Python 社区讨论了。我不是 Python 专家。

继续加油！：）

1 回复有任何疑惑可以回复我~

收起回答

提问者慕的地7544270 #1

谢谢老师回答！
对于(5): 我用本地的pycharm，按照题目规定的取值范围，随机生成了含有32个测试用例的数组。
用这个数组测试上述几种写法。发现 x**2 + y**2 还是显著慢于 x*x + y*y的代码：
上述350ms代码在本地平均用时1s左右，该代码仅改动d的计算为 d = (x1-x2)**2 + (y1-y2)**2，我发现稳定性变差很多，平均时间也变为1.9s左右。上述1100ms的代码在本地2.6s左右。
其他的解释器和调试工具，我没有研究过，先去了解一下，再来试试这个问题。

回复有任何疑惑可以回复我~ 2021-09-12 13:02:09

447 Python不同的实现，时间差别很大的原因？

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

关于leetcode309题的一个小疑惑（java）

请问这两个memo[i]有什么区别？为什么要这样写?比如i=2时，右边那个memo[i]不是没有初值吗？怎么比较？

Leetcode 864疑问

二分查找法floor和ceil的边界问题

LeetCode 18-4Sum

更多经典面试问题

动态规划的经典问题

不会翻转二叉树的大神

两种关于 topK 问题求解思路的套路

大厂面试为什么总考算法？

热搜

最近搜索清空