设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 技术文摘 查看内容

程序员编程艺术第二十八~二十九章:最大连续乘积子串、字符串编辑距离 ...

2013-3-28 14:32| 发布者: 红黑魂| 查看: 3840| 评论: 0|原作者: v_JULY_v|来自: CSDN博客

摘要: 前言    时间转瞬即逝,一转眼,又有4个多月没来更新blog了,过去4个月都在干啥呢?对的,今2013年元旦和朋友利用业余时间一起搭了个方便朋友们找工作的编程面试算法论坛:为学论坛http://www.51weixue.com/。最近 ...

前言

   

   时间转瞬即逝,一转眼,又有4个多月没来更新blog了,过去4个月都在干啥呢?对的,今2013年元旦和朋友利用业余时间一起搭了个方便朋友们找工作的编程面试算法论坛:为学论坛http://www.51weixue.com/。最近则开始负责一款在线编程挑战平台:英雄会的产品运营http://hero.pongo.cn/,当然拉,虽说是产品运营,实际上身兼“数职”:出题审题,写代码测试,制定比赛规则等等一个都不敢落下。

    

  前几天跟百度的几个朋友线下闲聊,听他们说,百度校招群内的不少朋友在找工作的时候都看过我的blog,一听当即便激起了自己重写此blog的欲望,恰巧眼下阳春三月(虽说已是3月,奇妙的是,前两天北京还下了一场大雪),又是找工作的季节(相对于每年的9月份来说,3月则是一个小高潮),那就从继续更新专为IT人员找工作时准备笔试面试的程序员编程艺术系列开始吧。

    

  再者从去年4月份上传的编程艺术前27章的PDF文档的1.3万下载量来看http://download.csdn.net/detail/v_july_v/4256339,此系列确确实实帮助了成千上万的人。Yeah,本文讲两个问题,


  • 第二十八章、最大连续乘积子串,

  • 第二十九章、字符串编辑距离,

    

  这两个问题皆是各大IT公司最喜欢出的笔试面试题,比如说前者是小米2013年校招笔试原题,而后者则更是反复出现,如去年9月26日百度一二面试题,10月9日腾讯面试题第1小题,10月13日百度2013校招北京站笔试题第二 大道题第3小题,及去年10月15日2013年Google校招笔试最后一道大题皆是考察的这个字符串编辑距离问题。

    

  OK,欢迎朋友们在本文下参与讨论,如果用Java/C#的朋友想在线编译自己的代码,可以上英雄会提交你的代码,有任何问题,欢迎随时不吝批评或指正,感谢。


第二十九章、最大连续乘积子串


题目描述:给一个浮点数序列,取最大乘积连续子串的值,例如 -2.5,4,0,3,0.5,8,-1,则取出的最大乘积连续子串为3,0.5,8。也就是说,上述数组中,3 0.5 8这3个数的乘积3*0.5*8=12是最大的,而且是连续的。


提醒:此最大乘积连续子串与最大乘积子序列不同,请勿混淆,前者子串要求连续,后者子序列不要求连续。也就是说:最长公共子串(Longest CommonSubstring)和最长公共子序列(LongestCommon Subsequence,LCS)的区别:

子串(Substring)是串的一个连续的部分,

  • 子序列(Subsequence)则是从不改变序列的顺序,而从序列中去掉任意的元素而获得的新序列;
    
  更简略地说,前者(子串)的字符的位置必须连续,后者(子序列LCS)则不必。比如字符串acdfg同akdfc的最长公共子串为df,而它们的最长公共子序列LCS是adf,LCS可以使用动态规划法解决。


解答


    解法一、穷举,所有的计算组合:


    或许,读者初看此题,自然会想到最大乘积子序列问题类似于最大子数组和问题:http://blog.csdn.net/v_JULY_v/article/details/6444021,可能立马会想到用最简单粗暴的方式:两个for循环直接轮询。

  1. double max=0;  
  2. double start=0;  
  3. double end=0;  
  4. for (int i=0;i<num;i++) {  
  5.     double x=arrs[i];  
  6.     for (int j = i+1; j < num; j++) {  
  7.         x*=arrs[j];  
  8.         if(x>max){  
  9.             max=x;  
  10.             start=arrs[i];  
  11.             end=arrs[j];  
  12.         }  
  13.     }  

     解法二、虽说类似于最大子数组和问题,但实际上具体处理起来诸多不同。为什么呢,因为乘积子序列中有正有负也还可能有0。我们可以把问题简化成这样:数组中找一个子序列,使得它的乘积最大;同时找一个子序列,使得它的乘积最小(负数的情况)。因为虽然我们只要一个最大积,但由于负数的存在,我们同时找这两个乘积做起来反而方便。也就是说,不但记录最大乘积,也要记录最小乘积。So,我们让

  • maxCurrent表示当前最大乘积的candidate,
  • minCurrent反之,表示当前最小乘积的candidate,
  • 而maxProduct则记录到目前为止所有最大乘积candidates的最大值。
以上用candidate这个词是因为只是可能成为新一轮的最大/最小乘积)
    由于空集的乘积定义为1,在搜索数组前,maxCurrent,minCurrent,maxProduct都赋为1。
假设在任何时刻你已经有了maxCurrent和minCurrent这两个最大/最小乘积的candidates,新读入数组的元素x(i)后,新的最大乘积candidate只可能是maxCurrent或者minCurrent与x(i)的乘积中的较大者,如果x(i)<0导致maxCurrent<minCurrent,需要交换这两个candidates的值。

    当任何时候maxCurrent<1,由于1(空集)是比maxCurrent更好的candidate,所以更新maxCurrent为1,类似的可以更新minCurrent。任何时候maxCurrent如果比最好的maxProduct大,更新maxProduct。

    代码一
  1. template <typename Comparable>    
  2. Comparable maxprod( const vector<Comparable>&v)    
  3. {    
  4.     int i;    
  5.     Comparable maxProduct = 1;    
  6.     Comparable minProduct = 1;    
  7.     Comparable maxCurrent = 1;    
  8.     Comparable minCurrent = 1;    
  9.     //Comparable t;    
  10.     
  11.     for( i=0; i< v.size() ;i++)    
  12.     {    
  13.         maxCurrent *= v[i];    
  14.         minCurrent *= v[i];    
  15.         if(maxCurrent > maxProduct)     
  16.             maxProduct = maxCurrent;    
  17.         if(minCurrent > maxProduct)    
  18.             maxProduct = minCurrent;    
  19.         if(maxCurrent < minProduct)    
  20.             minProduct = maxCurrent;    
  21.         if(minCurrent < minProduct)    
  22.             minProduct = minCurrent;    
  23.         if(minCurrent > maxCurrent)    
  24.             swap(maxCurrent,minCurrent);    
  25.         if(maxCurrent<1)    
  26.             maxCurrent = 1;    
  27.         //if(minCurrent>1)    
  28.         //    minCurrent =1;    
  29.     }    
  30.     return maxProduct;     
  31. }    

    代码二:思路,记录以第i个结尾的最大乘积M和最小乘积m,并且记录这两个区间的起点(终点都是i),不断更新,来源http://www.51weixue.com/thread-246-1-1.html

  1. pair<int,int> maxproduct(double *f,int n) { //返回最大乘积的起点终点  
  2. int R = 0, r = 0;   //最大最小区间的 起点  
  3. pair<int,int> ret = make_pair(0, 0);   //最大 最小的区间下标  
  4. double M = f[0], m = f[0], answer = f[0];     // 最大 最小值  
  5.     for (int i = 1; i < n; ++i) {  
  6.         double t0 = f[i] * M, t1 = f[i] * m;  
  7.         if (t0 > t1) {  
  8.             M = t0;  
  9.             m = t1;  
  10.         }  
  11.         else {  
  12.             int t = R;  
  13.             R = r;  
  14.             r = t;  
  15.             M = t1;  
  16.             m = t0;  
  17.         }  
  18.         if (M < f[i]) {  
  19.             M = f[i];  
  20.             R = i;  
  21.         }  
  22.         if (m > f[i]) {  
  23.             m = f[i];  
  24.             r = i;  
  25.         }  
  26.         if (answer < M) {  
  27.             answer = M;  
  28.             ret = make_pair(R, i);  
  29.         }  
  30.            
  31.            
  32.     }  
  33.     return ret;  
  34. }  

    解法三
    本题除了上述类似最大子数组和的解法,也可以直接用动态规划求解(其实,上述的解法一本质上也是动态规划,只是解题所表现出来的具体形式与接下来的解法二不同罢了。这个不同就在于下面的解法二会写出动态规划问题中经典常见的状态转移方程,而解法一是直接求解)。具体解法如下:
    假设数组为a[],直接利用动归来求解,考虑到可能存在负数的情况,我们用Max来表示以a结尾的最大连续子串的乘积值,用Min表示以a结尾的最小的子串的乘积值,那么状态转移方程为:
       Max=max{a, Max[i-1]*a, Min[i-1]*a};
       Min=min{a, Max[i-1]*a, Min[i-1]*a};
    初始状态为Max[1]=Min[1]=a[1]。

    C/C++代码

  1. /*  
  2.  给定一个浮点数数组,有正有负数,0,正数组成,数组下标从1算起  
  3.  求最大连续子序列乘积,并输出这个序列,如果最大子序列乘积为负数,那么就输出-1  
  4.  用Max[i]表示以a[i]结尾乘积最大的连续子序列  
  5.  用Min[i]表示以a[i]结尾乘积最小的连续子序列  因为有复数,所以保存这个是必须的  
  6. */    
  7. void longest_multiple(double *a,int n){    
  8.  double *Min=new double[n+1]();    
  9.  double *Max=new double[n+1]();    
  10.  double *p=new double[n+1]();    
  11.  //初始化    
  12.  for(int i=0;i<=n;i++){    
  13.   p[i]=-1;    
  14.  }    
  15.  Min[1]=a[1];    
  16.  Max[1]=a[1];    
  17.  double max_val=Max[1];    
  18.  for(int i=2;i<=n;i++){    
  19.   Max[i]=max(Max[i-1]*a[i],Min[i-1]*a[i],a[i]);    
  20.   Min[i]=min(Max[i-1]*a[i],Min[i-1]*a[i],a[i]);    
  21.   if(max_val<Max[i])    
  22.    max_val=Max[i];    
  23.  }    
  24.  if(max_val<0)    
  25.   printf("%d",-1);    
  26.  else    
  27.   printf("%d",max_val);    
  28. //内存释放    
  29.  delete [] Max;    
  30.  delete [] Min;    
  31. }  

    C#版完整代码(代码来自参加英雄会在线编程挑战之1019、最大乘积连续子串:http://hero.pongo.cn/Question/Details?ID=19&ExamID=19的在线提交代码的用户):

  1. //答题英雄:danielqkj  
  2. using System;  
  3. public class Test   
  4. {  
  5.     void Max(double a, double b, double c)  
  6.     {  
  7.         double d = (a>b)?a:b;  
  8.         return (d>c)?d:c;      
  9.     }  
  10.       
  11.     void Min(double a, double b, double c)  
  12.     {  
  13.         double d = (a>b)?b:a;  
  14.         return (d>c)?c:d;  
  15.     }  
  16.       
  17.       
  18.     public static void Main()  
  19.     {  
  20.         int n = Int32.parse(Console.readline());  
  21.         double[] a = new double[n];  
  22.         double maxvalue = a[0];  
  23.         double[] max = new double[n];  
  24.         double[] min = new double[n];  
  25.         double start, end;  
  26.           
  27.         String[] s = Console.readline().split(' ');  
  28.         for (int i = 0; i < n; i++)  
  29.         {  
  30.             a[i] = Double.parse(s[i])  
  31.         }  
  32.           
  33.         max[0] = a[0];  
  34.         min[0] = a[0];  
  35.         start = 0, end = 0;  
  36.           
  37.         for (int i = 1; i < n; i++)  
  38.         {  
  39.             max[i]=Max(a[i], a[i]*max[i-1], a[i]*min[i-1]);  
  40.             min[i]=Min(a[i], a[i]*max[i-1], a[i]*min[i-1]);  
  41.               
  42.             if (max[i] > maxvalue)  
  43.             {  
  44.                 maxvalue = max[i];  
  45.                 end = i;  
  46.             }  
  47.         }  
  48.           
  49.         double mmm = maxvalue;  
  50.         while ( (mmm - 0.0) > 0.00001 )  
  51.         {  
  52.             start = end;  
  53.             mmm = mmm / a[start];  
  54.         }  
  55.           
  56.         Console.Writeline(a[start] + " " + a[end] + " " + maxvalue);  
  57.           
  58.     }  
  59. }  

    提炼简化下上面的核心代码为:

  1. double func(double *a,const int n)  
  2. {  
  3.     double *maxA = new double[n];  
  4.     double *minA = new double[n];  
  5.     maxA[0] = minA[0] =a[0];  
  6.     double value = maxA[0];  
  7.     for(int i = 1 ; i < n ; ++i)  
  8.     {  
  9.         maxA[i] = max(max(a[i],maxA[i-1]*a[i]),minA[i-1]*a[i]);  
  10.         minA[i] = min(min(a[i],maxA[i-1]*a[i]),minA[i-1]*a[i]);  
  11.         value=max(value,maxA[i]);  
  12.     }  
  13.     return value;  
  14. }  


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部