C: 在一个函数中比较两个字符串的问题

C: Problem in comparing two strings in a function

大家早上好,我要用自己写的一个函数来模拟strstr()函数的运行

在代码中,我将原始字符串滑动到一个临时字符串中,然后与要查找的字符串进行比较,如果它们相等,则应该 return 1.

但即使字符串相等且长度相同,代码也永远不会进入 if 循环,因此永远不会 returns 1.

我的代码:

int *strstr_new(char *s7, char *s8) {

int length_s7 = strlen(s7);
int length_s8 = strlen(s8);
char search_string[length_s8];
printf("%d\n", length_s8);

for(int i=0; i<length_s7; i++) {
    for(int j=0; j<length_s8; j++) {
        search_string[j] = s7[i+j];
        search_string[j+1] = '[=10=]';
    }
    printf("%s\n", s8);
    printf("%s\n", search_string);
    printf("%d\n", length_s8);
    printf("%d\n", strlen(search_string));
    //search_string[length_s8+1] = '[=10=]';
    if(search_string == s8) {
        return(1);
    }
}
if(search_string != s8) {
    return(NULL);
}}

有人知道我哪里错了吗?

谢谢!

您的代码中最大的问题是使用 == 运算符比较字符串。 search_strings8 都是 char 指针,这意味着你在比较不同变量的地址,显然 return False。尝试添加另一个 for 循环以将 search_string 中的每个 chars8 中相应的 char 进行比较(使用取消引用运算符 *)。

  • 您的字符串比较将不起作用,因为您比较的是这些字符串的地址而不是字符串本身,您需要使用 strcmp 或 [=14= 之类的东西] 比较两个字符串。

  • 您的 return 类型也不与您拥有的 return 兼容,特别是如果字符串匹配。如果找到字符串,我会 return 1 ;如果没有找到,我会返回 0 ,为此你需要将 return 类型更改为 int only.

  • 不需要第二次字符串比较,您已经测试了循环内子字符串的存在,因此如果循环发现它已经结束,您只需要 return 0。

  • 最后,临时字符串太短,将允许在其范围外、循环内进行访问。

    例如如果length_s84将写入 search_string[4], 5th索引,超出数组范围。

int strstr_new(char *s7, char *s8) //return 1 for found, 0 for not found
{
    int length_s7 = strlen(s7);
    int length_s8 = strlen(s8);   
    char search_string[length_s8 + 1];//you'd want to avoid buffer overflow

    for (int i = 0; i < length_s7; i++)
    {
        for (int j = 0; j < length_s8; j++)
        {
            search_string[j] = s7[i + j];
            search_string[j + 1] = '[=10=]';
        }

        if (!strcmp(search_string, s8))
        {
            return 1; //if the string is found return 1 immediately
        }
    }
    return 0; //if it reaches this point, no match was found
}

一些测试:

printf("%d\n", strstr_new("this is my string", "this i"));
printf("%d\n", strstr_new("this is my string", "ringo"));
printf("%d\n", strstr_new("this is my string", "ring"));
printf("%d\n", strstr_new("this is my strin", "ths"));

输出:

1
0
1
0

函数声明

int *strstr_new(char *s7, char *s8);

看起来很奇怪。

例如为什么return类型是int *? 为什么函数参数命名为 s7s8 而不是 s1s2? 为什么函数参数没有用const限定?

在函数内创建可变长度数组效率低且冗余,并且可能导致堆栈耗尽。

char search_string[length_s8];

这个循环

for(int j=0; j<length_s8; j++) {
    search_string[j] = s7[i+j];
    search_string[j+1] = '[=12=]';
}

调用未定义的行为,因为此语句

search_string[j+1] = '[=13=]';
j 等于 length_s8 - 1 时,

写入数组之外。

在此声明中

if(search_string == s8) {

比较了两个指针,很明显它们是不相等的,因为它们指向不同的数组。

除了函数 strlen(也可以显式定义)之外,不使用标准 C 函数,函数可以按以下方式声明和定义

#include <stdio.h>
#include <string.h>

char * strstr_new( const char *s1, const char *s2 )
{
    char *p = NULL;
    
    size_t n1 = strlen( s1 );
    size_t n2 = strlen( s2 );
    
    if ( !( n1 < n2 ) )
    {
        for ( size_t i = 0, n = n1 - n2 + 1; p == NULL && i < n; i++ )
        {
            size_t j = 0;
        
            while ( j < n2 && s1[i + j] == s2[j] ) ++j;
        
            if ( j == n2 ) p = ( char * )( s1 + i );
        }
    }
    
    return p;
}

int main( void ) 
{
    const char *s1 = "strstr_new";
    const char *s2 = "str";
    
    for ( const char *p = s1; ( p  = strstr_new( p, s2 ) ) != NULL; ++p )
    {
        puts( p );
    }
}   

程序输出为

strstr_new
str_new

如果允许将标准字符串函数与 strlen 一起使用,则函数 strstr_new 中的循环可以按以下方式简化

for ( size_t i = 0, n = n1 - n2 + 1; p == NULL && i < n; i++ )
{
    if ( memcmp( s1 + i, s2, n2 ) == 0 ) p = ( char * )( s1 + i );
}