DNA序列 DNA Consensus String

发布时间:2023年12月20日

?代码实现(为个人思路,并非最优解):

#include <stdio.h>
#include <stdlib.h>
#define MAX_ARR 256

int main()
{
	int m, n;
	scanf("%d %d", &m, &n);
	getchar();
	//动态内存开辟一个二维数组
	char** s = (char**)calloc(m, sizeof(char*));
	if (s == NULL)
	{
		perror("calloc_s");
		return 1;
	}
	for (int i = 0; i < m; i++)
	{
		s[i] = (char*)calloc(n + 1, sizeof(char));
		if (s[i] == NULL)
		{
			perror("calloc_s[]");
			return 1;
		}
	}
	//赋值
	int count = 0;
	for (int i = 0; i < m; i++)
	{
		gets_s(s[i],n + 1);
	}
	printf("\n");
	//找最优解
	for (int j = 0; j < n; j++)
	{
		int arr[MAX_ARR]= { 0 };
		//统计各个字母的个数
		for (int i = 0; i < m; i++)
		{
			arr[s[i][j]] += 1;
		}
		//找个数最多的字母
		int sign = 0;
		int max = 0;
		for (int k = 65; k <= 90; k++)
		{
			if (k == 65)
			{
				max = arr[k];
				sign = k;
			}
			else if (max < arr[k])
			{
				max = arr[k];
				sign = k;
			}
		}
		//计算距离,打印一列的最优解
		count = count + (m - arr[sign]);
		printf("%c", sign);
	}
	printf("\n%d",count);
    //空间释放
	for (int i = 0; i < m; i++)
	{
		free(s[i]);
		s[i] = NULL;
	}
	free(s);
	s = NULL;

	return 0;
}

?

思路:1.遍历每一列字符序列,并将出现的次数存在数组中;

2.序列的每一列找出出现次数最多的字母,并打印出来(即为最优解);(特殊情况:遇到最大数字相同的字母,打印字典序小的字母,这里代码的处理方式是:由于遍历是由下标从大到小遍历,所以对应字典序也是从小到大的,又由于判断条件是max? < arr[k],所以sign小标不会更新,打印的仍然是字典序小的字母)

3.最小距离为每一列与最优解不同的字母的总和。

文章来源:https://blog.csdn.net/cookies_s_/article/details/135087156
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。