Python世界:力扣题43大数相乘算法实践

Python世界:力扣题43大数相乘算法实践

任务背景


问题来自力扣题目43:字符串相乘,大意如下:

Given two non-negative integers num1 and num2 represented as strings, return the product of num1 and num2, also represented as a string.

翻译下,需求是:实现大数相乘,字符串乘法

  1. 输入为非负整数两个字符串
  2. 要求输出该大数值的乘积

思路分析


方案1

自然的想法是,模拟乘法运算,考验对实际问题的计算机转换,先手动模拟下计算过程,提炼其中算法,如果最高位相乘及低位相加无累进,则提前退出。

shell 复制代码
99*99=9801  2*2=4
10*10=100   2*2=3

以下示例,运行时间击败32%:

python 复制代码
# sol1:暴力法遍历
class Solution:
    def multiply(self, num1: str, num2: str) -> str:
        # corner case
        if num1 == "0" or num2 == "0":
            return "0"
        elif num1 == "1":
            return num2
        elif num2 == "1":
            return num1

        # common case
        len1 = len(num1)
        len2 = len(num2)
        len_sum = len1 + len2
        len_max = max(len1, len2)
        len_min = min(len1, len2)

        # 从低位往高位相互进位,个、十、百、千、......
        n1_rev = num1[::-1]
        n2_rev = num2[::-1]
        multi_res_list = []
        base = 10
        c = 0 # carrier

        # 暴力法
        for b in range(len_sum + 1):
            val = 0
            res = 0
            # 获取一个阶的结果,如百、十、千
            for i in range(len1):
                if i > b or b - i >= len2: # i,j比目标进位大,已到头
                    continue
                j = b - i # j>=0 && j<len2
                n1 = int(n1_rev[i])
                n2 = int(n2_rev[j])
                res += n1 * n2
            
            # 处理一个阶的结果
            res += c
            c = res // base
            val = res - c * base
            assert(val < base)
            if (c == 0 and val == 0 and b > len_max): # 去除冗余前导零
                continue
            multi_res_list.append(str(val))

        # 将列表逆序并转化为字符串输出
        # multi_res_list = multi_res_list.reverse() # 未按预期运行,输出结果为None
        multi_res_list = multi_res_list[::-1]
        non_zero_idx = 0
        for val in multi_res_list:
            if (val == "0"):
                non_zero_idx += 1
            else:
                break
        multi_res_list = multi_res_list[non_zero_idx:]

        multi_res_str = "".join(multi_res_list) # 列表转字符串
        return multi_res_str

方案2

尝试进一步改进:

  • 通过限制上下界,降低内外for循环次数
    • 内循环len1选两者较小的长度
    • 如果i大于b时,直接break
    • 外循环b设计提前退出条件,当前导都是零时,无计算必要
  • 不整体逆序,直接从末尾字符低位往高位移动(TBD)
python 复制代码
# sol2:beat 42.5%
class Solution:
    def multiply(self, num1: str, num2: str) -> str:
        # corner case
        if num1 == "0" or num2 == "0":
            return "0"
        elif num1 == "1":
            return num2
        elif num2 == "1":
            return num1

        # common case
        len1 = len(num1)
        len2 = len(num2)
        len_sum = len1 + len2
        len_max = max(len1, len2)
        len_min = min(len1, len2)

        # 从低位往高位相互进位,个、十、百、千、......
        n1_rev = num1[::-1]
        n2_rev = num2[::-1]
        multi_res_list = []
        base = 10
        c = 0 # carrier

        # 暴力法
        for b in range(len_sum): # b [0, len_sum-1]
            val = 0
            res = 0
            # 获取一个阶的结果,如百、十、千
            for i in range(len1):
                if i > b:
                    break
                if b - i >= len2: # i,j比目标进位大,已到头
                    continue
                j = b - i # j>=0 && j<len2
                n1 = int(n1_rev[i])
                n2 = int(n2_rev[j])
                res += n1 * n2
            # 处理一个阶的结果
            res += c
            c = res // base
            val = res - c * base
            assert(val < base)
            if (c == 0 and val == 0 and b > len_max): # 去除冗余前导零
                continue
            multi_res_list.append(str(val))
            if (b + 1 == len_sum and c == 0):
                break # 最高位相乘无进位


        # 将列表逆序并转化为字符串输出
        # multi_res_list = multi_res_list.reverse() # 未按预期运行,输出结果为None
        multi_res_list = multi_res_list[::-1]
        non_zero_idx = 0
        for val in multi_res_list:
            if (val == "0"):
                non_zero_idx += 1
            else:
                break
        multi_res_list = multi_res_list[non_zero_idx:]

        multi_res_str = "".join(multi_res_list) # 列表转字符串
        return multi_res_str

方案3

网上参考的一种实现,运行时间对比:

python 复制代码
# # sol3:beat 29.9%
# # 参考解法:https://blog.csdn.net/huqinweI987/article/details/88797663
class Solution:
    def multiply(self, num1: str, num2: str) -> str:
        if num1 == '0' or num2 == '0':#有0就不用乘了。
            return '0'
        res = ''
        carry = 0#初始化
        # 两个数的长度,分别都减1
        m = len(num1) - 1
        n = len(num2) - 1
        # m和n都是len减1,是因为,15*15中,不算被动进位,能用来主动计算乘法的,最高位就是百位,10*10=100,是主动计算的最高位。
        # k就在[0,m+n]的区间:代表主动计算乘法的位(最后多出来的进位单独给出)。k=0,i和j都是0,5*5,对应个位结果。
        # k=1,i和j分别是0、1和1、0组合,是10和5或者5和10,对应十位的结果,
        # k=2,i和j分别是1、1(其他组合不满足筛选条件,我计算的就是百位,不能把5也拿来用吧,把乘法写一下就出来了),代表10和10相乘,对应百位结果。
        for k in range(m + n + 1):
            print('k:',k)
            # i是所有输出位,包括k=m+n,不包括m+n+1,其实就是遍历所有可能的num1和num2的单独一位,做一个总的累加
            # i、j他俩是严格针对k的互补关系。i = 时,j = 1;i = 1时,j = 0,他们都对应结果的"下标"k=1,也就是"十位"
            sum = carry#先把进位计算进来(这个顺序其实无所谓,但是如果不是先进位,就要给sum清零了)
            for i in range(k + 1):#k其实就是结果位。i和j是根据k做的互补,严格对应一个结果底位。
                j = k - i
                if i <= m and j <= n:
                    index_i = m - i# 转换,字符串形式,i=0其实代表的是最大的那个数,不是最小的,index_i才是最小的数。
                    index_j = n - j
                    sum += int(num1[index_i]) * int(num2[index_j])#
            # 拼接结果字符串,遍历完当前k对应的所有i和j的组合,当前位的结果已经出炉,可以拼接了。比如15*15的最后一位5*5,是由当前位停留结果5和进位2组成的,当前结果就留在这。
            res = str(sum % 10) + res#从低位向高位迭代,使用新的sum模,后加res的拼接方式。
            carry = sum // 10#进位,5*5=25,进位2
 
        if carry:#最后一位了,k迭代的是乘法计算,当然可能发生进位,比如33*44中,k是0到2,最高位3*4肯定要进位的
            res = str(carry) + res
        return res

方案4

参考烧脑版的第二个直观优雅的思路,进行python实现:先乘,再进位,代码如下:

python 复制代码
# sol4:beat 34%
# 参考烧脑版的第二个思路进行python实现:先乘,再进位
class Solution:
    def multiply(self, num1: str, num2: str) -> str:
        # corner case
        if num1 == "0" or num2 == "0":
            return "0"
        elif num1 == "1":
            return num2
        elif num2 == "1":
            return num1

        # common case
        len1 = len(num1)
        len2 = len(num2)
        len_sum = len1 + len2

        # 从低位往高位相互进位,个、十、百、千、......
        n1_rev = num1[::-1]
        n2_rev = num2[::-1]
        multi_res_list = []

        # 整体乘完放1个数组
        num_rev_list = [0]*(len_sum)
        for i in range(len1):
            for j in range(len2):
                n1 = int(n1_rev[i])
                n2 = int(n2_rev[j])
                num_rev_list[i + j] += n1 * n2

        base = 10
        # 统一处理进制问题
        for i in range(len(num_rev_list) - 1):
            num_rev_list[i+1] += num_rev_list[i] // base
            num_rev_list[i] = num_rev_list[i] % base
        # 处理最高位的corner case
        # if (num_rev_list[len_sum - 1] == 0):

        multi_res_list = num_rev_list[::-1]
        non_zero_idx = 0
        for val in multi_res_list:
            if (val == 0):
                non_zero_idx += 1
            else:
                break
        multi_res_list = multi_res_list[non_zero_idx:]

        multi_res_str = "".join((str(i) for i in multi_res_list)) # 列表中的每个数字转字符串
        return multi_res_str

无测试套主调

无测试套版本主调:

python 复制代码
# 无测试套版本主调
if __name__ == '__main__':
    print('start!')

    # num1 = "2"
    # num2 = "3"
    # ret = "6"

    # num1 = "99"
    # num2 = "99"
    # ret = "9801"

    num1 = "10"
    num2 = "10"
    ret = "100"

    # num1 = "1"
    # num2 = "123456789"
    # ret = "123456789"

    # num1 = "123456789"
    # num2 = "0"
    # ret = "0"

    # num1 = "123"
    # num2 = "456"
    # ret = "56088"

    # num1 = "37689269854"
    # num2 = "12548698156"
    # ret = "472951271117876189224"

    # num1 = "6"
    # num2 = "501"
    # ret = "3006"

    problem = Solution()
    res = problem.multiply(num1, num2)
    assert(res == ret)
    print(res, "right!")

    print('done!')

测试套主调

编写含单元测试的主调:

python 复制代码
# 导入单元测试
import unittest

# function...

# 编写测试套
class TestSol(unittest.TestCase):
    def test_bound1(self):
        num1 = "2"
        num2 = "3"
        ret = "6"
        sol = Solution()
        self.assertEqual(sol.multiply(num1, num2), ret)

    def test_bound2(self):
        num1 = "37689269854"
        num2 = "12548698156"
        ret = "472951271117876189224"
        sol = Solution()
        self.assertEqual(sol.multiply(num1, num2), ret)

    def test_bound3(self):
        num1 = "1"
        num2 = "123456789"
        ret = "123456789"
        sol = Solution()
        self.assertEqual(sol.multiply(num1, num2), ret)

    def test_bound4(self):
        num1 = "123456789"
        num2 = "0"
        ret = "0"
        sol = Solution()
        self.assertEqual(sol.multiply(num1, num2), ret)

    def test_special1(self):
        num1 = "6"
        num2 = "501"
        ret = "3006"
        sol = Solution()
        self.assertEqual(sol.multiply(num1, num2), ret)

    def test_special2(self):
        num1 = "10"
        num2 = "10"
        ret = "100"
        sol = Solution()
        self.assertEqual(sol.multiply(num1, num2), ret)

    def test_special3(self):
        num1 = "99"
        num2 = "99"
        ret = "9801"
        sol = Solution()
        self.assertEqual(sol.multiply(num1, num2), ret)

    def test_common_case(self):
        num1 = "123"
        num2 = "456"
        ret = "56088"
        sol = Solution()
        self.assertEqual(sol.multiply(num1, num2), ret)


# 含测试套版本主调
if __name__ == '__main__':
    print('start!')
    unittest.main() # 启动单元测试
    print('done!')

本文小结


为便于深入理解进制转换和乘法原理,同时提高编程能力,demo程序中新增单元测试代码实现。

卡壳点:

  1. 陷入复杂算法细节,而不是以终为始。在没明确思路前,先实现再优化,用笨办法/暴力法解决了,再尝试改进。
  2. corner case处理不当。 结尾中,输出字符串前导0场景。 中间乘积结果为0,进位符为0场景未考虑周全。

总的来说,推荐solution4方法进行解题。

此外,进阶想一想,如果将其变成大数加法,这个程序能否只改两三行代码,即可输出正确结果?再如,改成八进制乘法,如何搞?

题解参考

涉及知识点

  • python 纯数字list转化为字符串,link
  • Python字符串中添加、插入特定字符,link
  • Python 列表逆序排列的 3 种方式,link
  • 廖雪峰,Python自带单元测试,unittest
相关推荐
算法小白(真小白)2 小时前
低代码软件搭建自学第二天——构建拖拽功能
python·低代码·pyqt
唐小旭2 小时前
服务器建立-错误:pyenv环境建立后python版本不对
运维·服务器·python
007php0072 小时前
Go语言zero项目部署后启动失败问题分析与解决
java·服务器·网络·python·golang·php·ai编程
Chinese Red Guest2 小时前
python
开发语言·python·pygame
骑个小蜗牛3 小时前
Python 标准库:string——字符串操作
python
xiaoshiguang33 小时前
LeetCode:222.完全二叉树节点的数量
算法·leetcode
爱吃西瓜的小菜鸡3 小时前
【C语言】判断回文
c语言·学习·算法
别NULL3 小时前
机试题——疯长的草
数据结构·c++·算法
TT哇3 小时前
*【每日一题 提高题】[蓝桥杯 2022 国 A] 选素数
java·算法·蓝桥杯